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لايسمح بإعادة إصدار هذا الكتابء أو نقله في أي شكل أو وسيلة» 
سواء أكان إلكترونية أم يدوية أم ميكانيكية» بها في ذلك جميع أنواع تصوير المستندات بالنسخ» أو 
التسجيل أو التخزين» أو أنظمة الاسترجاع» دون إذن خطي من المركز بذلك. 


اب 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


الات 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


س 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقيا أو تداولها تجاريا - 


مقدمة الكتاب 


بسم الله والحمد لله والصلاة والسلام على سيدنا رسول الله» وبعد فهذا هو الكتاب 
الثاني في سلسلة كتب المؤلف في معالجة اللغة العربية آلياء وهو بعنوان «تقنيات اللغة 
العربية الحاسوبية - معايير التقييم ورؤى التطوير»» يعرض فيه المؤلف لعايير تقييم 
بعض التقنيات اللغوية الحاسوبية مع تقديم رؤى تطويرية لبعضهاء وآفاق جديدة 
لاستخدام بعضها. والكتاب كا يبدو من عنوانه يدور في فلك معالحة اللغات الطبيعية؛ 
متخذا من اللغة العربية ومن تقنياتها منطلقًا جديدًا لآفاق بحثية جديدة. 

وبهدف هذا الكتاب إلى تقديم منهج لغوي لتقييم التقنيات اللغوية الحاسوبية 
التي تعالج اللغة العربية» من خلال عدد من المعايبر اللغوية» فنظرة واحدة على بعض 
التقنيات العربية كافية لإدراك الهوة الواسعة بين خرجات هذه التقنيات وبين ما يجب 
أن تكون عليه النتائج المرجوة» ومن ثم دعت الحاجة إلى وضع لبنة لغوية لمعايبر تقييم 
هذه التقنيات» وستقتصر هذه المعايبر على الجانب اللغوي فقط تاركة الجانب الفنى 
للمتخصصين فيه فعند الحديث عن المعايير اللغوية لتقييم محركات البحث العربية على 
الشبكة العالمية - على سبيل المثال - سيقتصر تقييم محركات البحث على المعايير التي 
ينبغي توافرها في أي محرك بحثي عربي عند التعامل مع كلمات البحث العربية ونتائجهاء 
وهو ما سيجعل نتائج البحث صحيحة وسليمة. 


5 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


كما هيدف الكتاب إلى تقديم رؤى تطويرية جديدة لتطوير بعض التقنيات اللغوية 
العربية» يمكن من خلالها رفع كفاءة هذه التقنيات وتحسين جودة مخرجاتهاء کا هو 
الخال مع تطبيقات التعرف الآلي على الحروف العربية» أو يمكن من خلاها إبراز الدور 
التعليمي هذه التقنيات الحاسوبية» كا هو الحال مع المدققات الإملائية والنحوية؛ إذ 
يمتد دور هذه التقنيات اللغوية العربية إلى الإسهام في تعليم مستخدميها من العرب 
قواعد العربية كذلك» إضافة إلى دورها الأسامى في معالجة العربية آليا. 

ويعرض الكتاب لآفاق جديدة يمكن استخدام بعض التقنيات اللغوية فيها؛ لتحقيق 
الاستفادة القصوى من هذه التقنيات اللغوية وربطها بواقع المستخدم العربي» فمن هذه 
الآفاق - على سبيل المثال - مراجعة النص القرآني وتدقيقه آليّاه ومنها استخدام تقنيات 
الإحصاء اللغوية في تحليل مدونات النصوص العربية الضخمة والاستفادة من نتائج 
هذا التحليل في صياغة مناهج تعليمية للعربية المعاصرة» تتخذ من واقع اللغة أساسًا 

ويقع هذا الكتاب في مقدمة وثلاثة فصول؛ تتناول المقدمة التعريف بالكتاب 
وموضوعاته ومادته العملية وتقسيم فصوله ومباحثه» وتعرض لأهداف الكتاب 
والغرض من تأليفه وللتقنيات التى اعتمد عليها. 

أما الفصل الأول فهو بعنوان «معايير تقييم بعض التقنيات اللغوية» ويتناول المعايير 
اللغوية لتقييم ثلاثة من التقنيات اللغوية» ويقع في ثلاثة مباحث؛ المبحث الأول: 
اللغوية لتقييم محركات البحث العربية على شبكة الإنترنت» والمبحث الثالث: المعايير 
اللغوية والفنية لتقييم برامج التعرف الضوئي على الحروف العربية. 

وعنوان الفصل الثاني: «رؤى مطروحة لتطوير بعض التقنيات اللغوية» ويتناول 
رؤيتين لتطوير تقنيتين من التقنيات اللغوية الحاسوبية» ويقع في مبحثين اثنين؛ المبحث 
الأول يعرض مقترحا لتطوير تقنيات التدقيق الإملائي والنحوي لتفعيل دورها في 
تعليم العربية. والمبحث الثاني يقدّم مقترحا لتطوير آليات التعرف الآلي على الحروف 
العربية. 

والفصل الثالث بعنوان: «آفاق استخدام بعض التقنيات اللغوية» ويتناول أفقين 
تطبيقيين من آفاق استخدام التقنيات اللغوية» ويقع في مبحثين اثنين؛ المبحث الأول في 


کت 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 
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مراجعة النص القرآني وتدقيقه آليّا في دراسة لغوية حاسوبية» والمبحث الثاني في تحليل 
النصوص باستخدام تقنيات الإحصاء اللغوية. 

وني الخاتمة يعرض المؤلف أهم النتائج التي توصل إليها بحثه» وأهم التوصيات التي 
يوصي بها الدارسين والباحثين في مجال معالجة اللغة العربية. 


»»64»© 


۷ 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


-A- 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقيا أو تداولها تجاريا - 


الفصل الأول 
المبحث الأول 
المعايبر اللغوية لتقييم برامج التدقيق الإملائى والنحوي 


تمهيد: 

المدققان الإملائي والنحوي آليتان برمجيتان تتعاملان مع النصوص ١‏ في الكلمة 
والتركيب معًا)» وتتلخص وظيفتاهما في مراجعة صحة الكلمة إملاءً وإعرابًا وصحة 
الجملة تركيبّاء وفي اقتراح بدائل صحيحة للكلمة غير الصحيحة إملاءً أو نحوّاء أو 
اقتراح تعديل للجملة غير الصحيحة تركيبًا؛ لأجل الوصول إلى الصواب النحوي 
أو التركيبي. ويمكن إجمال المعايير اللغوية لتقييم برامج التدقيق الإملائي والنحوي 
فيما يأتي: 

المعايبر اللغوية لتقييم برامج التدقيق الإملائي والنحوي: 

١‏ - مدى توافر عدة مستويات لعمل المدقق الإملائى: 

إذ ينبغي أن تتحقق جايًا في تطبيقات التدقيق الإملائي مستويات التدقيق» ومن 
الممكين امراح ت رات قاب ريا - عل الو الأ : 

-١‏ التقيّد بقواعد الإملاء» ويعني: التقيّد بهمزة الألف الابتدائية أو بنقطتي الياء 
النهائية - على سبيل المثال -. 

؟- المرونة في التقيّد بقواعد الإملاء» ويعني التقيّد بهمزة الألف الابتدائية في 


۹= 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


خيارات التدقيق الإملائى (في حالة الكتابة المصرية) - على سبيل المثال-» وكذلك 
التقيد بنقطتي الياء النهائية في خيارات التدقيق الإملائي (في حالة الكتابة الشامية) - 
على سبيل المثال-. 

-٣‏ مراعاة الأخطاء الشائعة» ويعني عدم التقيد بهمزة الألف الابتدائية أو بنقطتي 
الياء النهائية- على سبيل المثال-. 


-١‏ مدى معالجة تطبيقات التدقيق الإملائي لأناط الأخطاء الإملائية الشائعة في 
النصوص العربية ومن أهمها: 

- الخلط بين أشكال همزتي القطع والوصل (أءإءا»!)» مثل كتابة كلمة «استقبال» 
بهمزة الوصل هكذا: «إستقبال»» «أستقبال»» «استقبال)». 

- الخلط بين الألف المقصورة (ى) والياء المنتقوصة (ي)» مثل كتابة كلمة «مرتضى» 
(بياء غير منقوطة) هكذا: «مرتضى) (بنقطتين). 

- الخطأ في رسم الممزات المتوسطة والمتطرفة (ء» ئ» ؤ» أ» آ)» مثل كتابة كلمة 
«شبىء» مبمزة على السطر هكذا: «شيئ» مبمزة على نبرة. 

0 الخلط بين التاء المربوطة (ة) والهاء له)» مثل كتابة كلمة «رماية»؛ هكذا: «رمايه» 
بهاء وليست بتاء مربوطة. 

- اتصال كلمتين دون مسافة بينهماء مثل كتابة كلمتي «اتصال كلمتين» هكذا: 
«اتصالكلمتين». 

- وجود نقص في حروف الكلمة, مثل كتابة كلمة «المحامي» هكذا: «المحام». 

- وجود تكرار أو زيادة في الكلمة» مثل كتابة كلمة (مشكور» هكذا: امشكووووور). 

- وجود قلب بين حروف الكلمة الواحدة» مثل كتابة كلمة «مشكور» هكذا: 
«(مکشور). 

- الحروف التى تنطق لهجيًا بطريقة مخالفة لكتابتهاء فحرف «الضاد» في بعض البلاد 
Ce‏ «ظاء» ومن ثم يكتبونها «ظاء»» وما رأيته على مواقع التواصل 
الاجتماعي عنوانا للكتاب المشهور «في ضلال القرآن»؛ بالضاد لا بالظاء؛ تأثرا باللهجة 
والضراب «في ظلال القرآن». 

- الخلط بين الحروف المتجاورة في لوحة مفاتيح الحاسوب» حيث يخطئ 


-١ه‎ 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


البعض في كتابة بعض الحروف نتيجة لسرعته في الكتابة على لوحة المفاتيح» مثل 
كتابة كلمة «فاروق» هكذا: «فاروف» وذلك لتجاور حرفي «الفاء» و»القاف» على 
لوحة المفاتيح» ويخطئون كذلك في الحروف التي تكتب بطريقة مركبة على لوحة 
المفاتيح مثل كتابة كلمة (إيهان» هكذا: «غيمان» حيث تكتب الممزة المكسورة عن 
طريق الضغط على (غ]51211 + ”. وني حال عدم الضغط على مفتاح ]51211 تكتب 
”غينا“ على الفور. 


*“- مدى معالجة تطبيقات التدقيق الإملائي للبسين الصرني والدلالي وحل 
مشكلاتب): 

فكثير من مستخدمي تطبيقات التدقيق الإملائي يضيقون ذرعا بتطبيقات التدقيق 
الإملائي» وذلك بسبب فشلها في اكتشاف الكثير من الأخطاء الإملائية لبعض 
الكليات في سياقات معيئة؛ واعتبارها كلمات صحيحة على الرغم من كونها خطأ في 
هذه السياقات. 

فكلمة «اضرب» بهمزة الوصل في سياق جملة «دعوني اضرب لكم مثلا»؛ تعد خطأ 
إملاتيًا بلزم تصويبه إلى الكلمة «أضرب» مهمزة القطع» ومع ذلك تقف تطبيقات التدقيق 
الإملائى عاجزة عن تصويب هذه الكلمة. وكذلك يتجاهل المدقق الخطأ الإملائى في 
كلم الا فى سياف لار ب الت الاقف وهر ما ي الفشل ف الف عل 
الخطأ واقتراح بدائل صحيحة لتصويبه. ۰ 

ويرجع السبب في ذلك إلى اللبس الصرفيء فالمدقق الإملائي يتعامل مع الكلمة 
المفردة على مستواها الصرفي فقط. ومن ثم فإن أية احتمالات صرفية للكلمة المراد 
تدقيقها صحيحة لغوياء بلا مراعاة للسياق اللغوي للكلمة» وهو ما يحمل المدقق على 
عدم الحكم بخطأ الكلمتين «اضرب» و)السنة» إملائياء على الرغم من خطأ استخدامهم| 
في هذين السياقين. 

إن التباس الشكل الكتابي لمضارع الثلاثي المكتوب خطأ هكذا (اضرب) مع 
كلمة أخرى صحيحة الشكل هي (اضرب - أمر الثلاثي) قد تسبب في تجاهل المدقق 
الإملائي للخطأ الإملائي ظاهرا (السياقي حقيقة) وعدم اكتشافه ومن ثم اقتراح 
البدائل الصحيحة له. 


تع 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


أما هذا الالتباس فيرجع إلى عدم اعتماد المدقق الإملائي على السياق اللغوي 
والدلالي عند تحليله للخطأ الإملائي واعتاده فقط على المحلل الصرني الذي 
عامل مم الكلبة ذو النظر إل اها في جا اشعب من نصيلة الضيارة 
-على سبيل المثال- لا يمكن للمدقق أن يكتشف النطأ في كلمة «(شعب» ومن 
ثم لا يقترح تصويبها إلى «عشب»» وذلك لأن كلمة «(شعب» صحيحة صرفياء 
ولكنها خطأ مع هذه المصاحبة» وليس من سمات المدققات الإملائية الحالية أن 
تعتمد على المصاحبات المعجمية بل تكتفي فقط بالتحليل الصرفي للكلمة دون 
سياقها الدلالي. 

ومن أمثلة تلك التراكيب؛ «بنات نادر» وصواما «نبات نادر»» و»تعقدت الجر حى)» 
وصوابها «تفقدت الجرحى)»» فالكلمتان «بنات»» واتعقدت» كلمتان صحيحتان 
صرفياء وهو ما حمل المدقق على الحكم بصحتهم|ء لكن السياق وحده هو ما يحكم بخطاً 
الكلمتين. 


٤‏ - مدى معالجحة تطبيقات التدقيق النحوي لآثار اللبس التركيبي: 

رأينا كيف يقف اللبس عقبة كأداء دون تحقيق الغاية من بعض التطبيقات 
اللغوية الحاسوبية العربية» وليست تطبيقات التدقيق النحوي بعيدة عن ذلك؛ 
إذ يؤثر اللبس التركيبي على قيام تطبيقات التدقيق النحوي هذه بعملها. فالمدقق 
«بالولدان» (مثنى ولد) إلى «بالولدين»ء وذلك لالتباس كلمة «بالوّلّدان» بكلمة 
«بالولدان» جمع التكسير من «ولد». بل يتعدئ الأمر ذلك إل غلاقاعا التركيبية 
في الجملة» فصفة كلمة «بالوّلّدان» (مثنى ولد) هي كلمة مثنى مذكرء تقول: 
بار a O‏ عليه انال ليا فهي جمع مذكر أو جمع تكسيرء 
تقول: «بالونّدان ا 

وثنائيات الكليات (لمب» هب / وعيد» وعيد / بطاقة» بطاقة / فطائر» فطائر) 
لا يستطيع المدقق النحوي العرف على علاقاتها التركيبية لاحتالاتها الصرفية ومن ثم 
التركيبية المتعددة » 


يات 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


فكلمة الحب» تحتمل أن تكون من باب: 

لهب: هب اسم من معانيه: ما يرتفع من النار كأنه لسان”". 

أو تكون من باب: 

هب: هَبَّ: لام التعليل + هَبَّ (فعل ماض» من معانيه: أسرع ونشطء ويقال هب 
فلان إلى الشيء: بض إليه) . 


وكلمة «وعيد» تحتمل أن تكون من باب: 

وعيد: وعيد» مصدر الفعل وَعَدَء يقال وعد فلانا الشر» ووعده به وعيداء بمعنى: 
هدده به" . 

أو کون عع بات 

وعيد: الواو حرف عطف + عيد (كل يوم يحتفل فيه بذكرى كريمة أو حبيبة) . 


وكلمة «بطاقة» تحتمل أن تكون من باب: 

بطاقة: (رقعة صغيرة من الورق وغيره» يكتب عليها اسم الشخص وعنوانه أو بيان 
تفلن ل 

أو تكون عن اب 

بطاقة: الباء حرف عطف + طاقة (الطاقة القدرة» وما يستطيع الإنسان أن يفعله 
بمشقة). 

وكلمة «فطائر» تحتمل أن تكون من باب: 

فطائر : (جمع فطيرة)» والفطيرة خبز تؤدم بزبد أو نحوه. 


١‏ - المعجم الوسيط, إبراهيم مصطفى, أحمد حسن الزيات» حامد عبدالقادر» محمد علي النجار» مجمع اللغة العربية 
بالقاهرة» طق ٠٠ ٠5‏ ص ٤‏ ۸۷» مادة «لهب). 


۲ -نفسه» ص ۰۷ 8 »١‏ مادة «(هہب». 
۳ -نفسه» ص »١ ٠/6‏ مادة (وعد). 
٤‏ - نفسه» ص ۰19۸ مادة «عود). 

ه - نفسه» ص ٠٦۳‏ مادة «بطق). 

5 - نفسه» ص 597.» مادة (طوق». 

۷ -نفسه» ص ۷۲۰» مادة «فطر). 


= 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


أو تكون من باب: 

فطائر: الفاء حرف عطف + طائر (وهو من الحيوان كل ما يطير في الهواء بجناحين)'. 

ومن ثم وجب على تطبيقات التدقيق الإملائي والنحوي معالجة اللبس اللغوي 
بآنواعه المختلفة الصرفية والتركيبية والدلالية» واعتبار ذلك معيارًا مهما من معايير 


ه- مدى نجاح عملية التصحيح التلقائي على المستوى الإملائي: 

يطرح المدقق الإملائي بدائل عديدة مقترحة تصحيحًا للخطأ الإملائي المكتشف في 
النص؛ من خلال نافذة صغيرة تحوي كلمات أخرى مقترحة لتصحيح الخطأ الموجود 
في حالة الخطأ الإملائي» وعادة ما ترتب هذه الاقتراحات ترتيبًا تنازليًا بدءًا بأوسعها 
انتشارًا وانتهاءً بالأقل. ويعتمد التصحيح التلقائي على ترتيب هذه البدائل ترتيبًا 
صحيحًا؛ إذ يختار المصحح التلقائي عند تفعيله من قبل المستخدم البديل الأول؛ خيارًا 
وحيدا للتصحيح في كل المواضع» ومن ثم فإن نجاح المصحح التلقائي في أداء مهمّته 
يعتمد في الأساس على الدقة في ترتيب البدائل. ولذا يمكن اعتبار مدى نجاح المدقق 
الإملائي في التصحيح التلقائي من معايير تقييم هذا المدقق. 


٦‏ - مدى تعلم المدقق الإملائي والنحوي من تصحيحات المستخدم ومدى استفادته 
من هذه التصحيحات في التصحيح التلقائي: 

فهناك مستوى ترود فيه بعض المدققات الإملائية بملفات تعمل بوصفها قاعدة 
بيانات معجمية لكلمات جديدة يحكم المدقق بخطئها على الرغم من صحتها لدى 
المستخدم, ومن ثم يمكن المدققٌ المستخدم من إضافة هذه الكلمات إلى قاعدة بيانات 
خاصة بهذه النسخة من البرنامج» يمكن من خلالها للمدقق الحكم بصحة هذه الكلمات 
عند تكرارها. 

وثمة مستوى آخر يمكن عذه معيارًا من معايبر تقييم المدقق الإملائي والنحوي 
وهو مدى الاستفادة من تصحيحات المستخدم ف التصحيح التلقائي» إذ يزداد المدقق 


| - نفسه» ص 040. مادة «طير). 


6 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


خبرة كلما استعمل مرة بعد مرة» فهو يخن خبراته لكي يستعملها مستقبلًا. فإذا ما قام 
المستخدم بتعديل خطأ معين سبق أن اكتشفه ال مدقق» فعلى المدقق حينئذ تصحيح الخطأ 
نفسه عند تكراره وفقا لتصحيح المستخدم. 

۷ مدى جاهزية المدقق الإملائي والنحوي للتعامل مع علامات الضبط بالشكل 
بنية وإعرابًا: 

وهو معيار قلا يتوافر في المدققات الإملائية والنحوية» وربا كان ذلك بسبب تخلي 
العربية المعاصرة عن علامات الضبط بالشكل» ولكنه ضروري في معالجة النصوص 
التراثية التى تحافظ على علامات الضبط بالشكل. 


464» 


0> 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


المبحث الثاني 
المعايير اللغوية لتقييم محركات البحث العربية على شبكة الإنترنت 


4 


مهيل: 

تعد نظم البحث واسترجاع المعلومات أحد أهم الطرق التي نلجأ إليها للتغلب 
على مشكلة فوضى المعلومات أو تضخم الإنتاج الفكري على الشبكة العالمية. ويمكن 
لمستخدمي محركات البحث التي تتعامل مع العربية على شبكة الإنترنت؛ أن يدرك الهوة 
الواسعة بين محرجات هذه المحركات وبين ما يجب أن تكون عليه النتائج المرجوة في 
يخص البحث باللغة العربية. 

وسيركز هذا المبحث على المعايير اللغوية لتقييم محركات البحث العربية على 
الشبكة العالمية» وسيقتصر تقييم محركات البحث لغويا - في هذا المبحث - على 
المعايير التي ينبغي توافرها في أي محرك بحثي عربي عند التعامل مع كلمات الببحث 
دون التطرق إلى نتائج البحثء ففي حالة نجاح المحرك في التعامل مع كلمات البحث 
وفق معايير لغوية محددة» فإن من شأن ذلك أن يسفر عن نتائجح جيدة وسليمة لكلمات 
البتحة هده 

ويدرس المبحث تقييم طريقة تعامل محرك البحث مع كلمات البحث على مستويين 
اثيين؛ مستوئ صرف :واخر دلال. 


ات 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


فمن المعايير اللغوية لتعامل حرك البحث مع كلمات البحث على المستوى الصرفي: 
١‏ - مراعاة التدقيق اللغوى للمدخلات(1122116). 
"- مراعاة الأشكال الكتابية: 


مراعاة أشكال الكلمات المعربة. 
مراعاة الأشكال اللهجية للكلات العربية. 


ج- مراعاة أشكال لغة الفرانكو آراب. 

د- مراعاة أشكال الكلمات المركبة من كلمتين بينهم| مسافة. 

ه - مراعاة أشكال الكلمات التي تحوي حروفا تنطق ولا تكتب. 

۳- مراعاة زوائد الكلمة العربية (من السوابق واللواحق) (41115 
.(Prefixes- suffixs‏ 

ومن المعايير اللغوية لتعامل محرك البحث مع كلمات البحث على المستوى الدلالي: 

مراعاة الترادف (577201277117). 

مراعاة المشترك اللفظي (رصر«مصه1). 

مراعاة اللبس الصرفي على مستوى كلمات البحث وعلى مستوى كلمات التوقف 

وذلك على التفصيل الآتي: 


المعايير اللغوية لتعامل محرك البحث مع كلمات البحث على المستوى الصرفي: 

ونعني بها المعايير المتعلقة بتعامل محرك البحث مع بنية كلمة البحث الصرفية من 
حيث صحتها لغويًا وأشكاطا الكتابية المختلفة. 

١‏ - مراعاة التدقيق اللغوي للمدخلات(]112211): 

ينبغي لمحرك البحث أن يدقق كلات المستخدم لغويّء تحسبًا وتداركًا لخطأ 
المستخدم, ومن ثم ينبّه المستخدم إلى الخطأ ويقترح الكلمة الصحيحة لكلمة البحث 
الخطأء ويقترح عرض النتائج الخاصة بالكلمة الصحيحة. وهو ما نلحظه في محرك 
البحث الشهير جوجل. 

لكنه - وإن اقترح الصورة الصحيحة للكلمة - لا همل الصور الخطأ كتابيًاء فإن 


15/- 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


حصر المحرّك بحثه على الكلمات الصحيحة فقط يقلّل من نتائج البحث ويتسبب في فقد 
الكثير من النتائج» فليس كل مستخدم عربي على علم بقواعد الكتابة والإملاء اللغوية. 
وهو ما ينقلنا إلى ضرورة مراعاة الأخطاء الإملائية الشائعة (0101201© م11 
5 506111118): وسنركز هنا على الأخطاء الإملائية المتعلقة بحروف بعينهاء 
كي 

أ-|-]إ-آ/ء-ق- ئ / ي -دى/ ة-ه 

ذكل خمر ع من جموعارت E‏ زينها عل الكلمة الواعدة وات 
غم -» فقد يكتب بعض مستخدمي الإنترنت كلمة «الاسلام) هكذا (همزة وصل)» 
وقد يكتبها أحدهم هكذا «الآسلام) مهمزة مفتوحة» وقد يكتبها أحدهم صحيحة هكذا 
«الإسلام» همزة قطع مكسورة. وعلى محرك البحث العربي أن يراعي صور كتابة كلمة 
البحث المختلفة صحيحة كانت أو خطأ. 

فإن أي آلف في أول الكلمة )١(‏ يمكن أن تكتب على ثلاثة أشكال: | = |= أ -آ, 
ومثاله: أيمن - ايمن - إيمن - آيمن. 

وإن أي همزة تليها ألف مد )1١(‏ في أول الكلمة وفي منتصفها يمكن أن تكتب: 1 
ومثاله: ءامنوا = آمنواء قرءان = قرآن. 

وإن أي همزة على السطر تليها واو مد (ءو) في منتصف الكلمة يمكن أن تكتب 
هكذا: ؤوء ومثاله: عبد الرءوف - عبد الرؤوف. 

وإن أي همزة على نبرة تليها واو مد (ئو) في منتصف الكلمة» يمكن كتابتها هكذا: 
ؤوء ومثاله: شئون = شؤون » مسئولية = مسؤولية. 

وإن أي همزة على نبرة (ى) في آخر الكلمة يمكن أن تكتب هكذا: يء وهكذا:ىء. 
ومثاله: شيء = شئ = شیئ = شىء. 

وإن أي ياء منقوطة (ي) في آخر الكلمة يمكن أن تكتب غير منقوطة هكذا (ى)» 
ومثاله: قاضي = قاضى = قاضٍ. 

وإن أي تاء مربوطة (5) في آخر الكلمة يمكن أن تكتب هاء (ه)» ومثاله: مدرسة - 
مدرسه. 

والخلاصة أن من الضروري لأي محرك بحث عربي أن يراعي الأخطاء الإملائية 
غد العف كرات عمل رز فا شكال عيلنة خط كانت أو صحيحةووالك بان 


-١/ 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


يتضمن مثلا بعض القواعد اللغوية التى من شأنها توليد الأشكال اللغوية المختلفة 
لكلمة البحث؛ الصحيحة منها والخطأ لضان توفير أكبر قدر من نتائج البحث. 


7 - مراعاة الأشكال الكتابية: 


أ- مراعاة أشكال الكلمات المعربة: 

تتفاوت صور كتابة بعض الكلمات العربية من بلد إلى آخرء لا سيها الكلات المعربة» 
وهو أمر ينبغي مراعاته في نظم البحث والاسترجاع» ومعيار لغوي مهم ينبغي تقييم 
محرك البحث العربي من خلاله» ومن صور ذلك على سبيل المثال: 

بعض الكلمات المعربة عن الإنجليزية»؛ حيث يمكن تعريب الحرف (6) إلى (ج) أو 
إلى (غ). 

فكلمة: رطم 81110812 تكتب «ببليو جرافيا») ‏ «ببليوغرافيا») 

وكلمة: ©[ع600 تكتب جوجل - غوغل. 

وكلمة: 323 تكتب كيلو جرام - كيلو غرام. 

وكلمة: 1011221 تكتب رومانتيكية ‏ رومانسية ‏ رومانطيقية 

وكلمة: 1110261 تكتب ميشيل - ميكائيل - مايكل - ميخائيل. 

ب- مراعاة الأشكال اللهجية للكلمات العربية: 

ولا يجب أن تقتصر معالجة محرك البحث العربي على مراعاة الأشكال الكتابية 
للكلمات المعربة فحسب بل يجب أن تمتد كذلك إلى أشكال هذه الكلمات في اللهجات 
العربية المختلفة» فكلمة: «جوجل» يكتبها البعض «قوقل» وكلمة: «رجال» يكتبها 
آخرون «ريال». 

ج- مراعاة أشكال لغة الفرانكو آراب: 

ينبغى أن ننبه إلى صورة أخرى من صور اختلاف الأشكال الكتابية وهى كتابة 
الخروك العربية بحروف لاتينية وهو ما يعرف بلغة الفرانكو آراب» وهي لكا يميد 
إليها الكثير من الشباب في غرف الدردشة على الإنترنت لعدم تمكنهم من الكتابة 
بحروف عربية» فيعمدون إلى كتابة حروف العربية بحروف لاتينية مع استبدال بعض 


الحروف الإنجليزية بأرقام إنجليزية تتشابه وصور الحروف العربية في الشكل» مثل: 


= 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


ء = ۴ ع = ۴ وغ = لاوخ دوو ط = 5ح = لاءخ = 7 . وهي لغة تخلط بين 
الحروف العربية والحروف والأرقام الإنجليزية» فكلمة ”حوار“ على سبيل المثال تكتب 
هكذا: VeWar‏ . 

وعلى محرك البحث العربي أن يجعل في الحسبان نقل كلمات البحث العربية إلى 
هذه اللغة» والبحث عن نتائجهاء ونقل كلمات البحث المكتوبة هذه اللغة إلى العربية 
والبحث عن نتائجها. 

د- مراعاة أشكال الكلمات المركبة من كلمتين بينهم| مسافة: 

في العربية كلمات بحث مركبة من كلمتين بينهم| مسافة» مثل ”عبد الله“ » ”أبو ظبي“. 
وينبغى على محرك البحث أن يراعى أن من صور كتابة كلمات البحث هذه حذف المسافة 
حر أى الل نيه بعل ازلهاكجبد انق ابو كلس 2 لوقي 

وقأفيه لف متعم ل اذاي كله مك يلاو حداف الراك من هرا بن كه أذ 
تلتصق بيا بعدها دون مسافة إذا كان آخر حرف في الكلمة الأولى أحد الحروف التالية: 
د ذ» ر» ز» و. وتلخصها القاعدة التالية: أي [كلمة بحث مركبة] = أي [كلمة ]١‏ + 
مسافة + [كلمة ؟] = أي [كلمة ١‏ تنتهى بأحد حروف(د» ذ» ر» ز» و)] + مسافة + 
031 ]د SRN EOE EE E‏ 
ا ۰ 

ه - مراعاة أشكال الكلمات التي تحوي حروفًا تنطق ولا تكتب ومثالها: (لكن = 
لاكن» داود = داوود» الرحمن = الرحمان) » فالبحث عن أي من صور الكلمات لابد أن 
يقتضي البحث عن صورها الأخرى؛ مراعاة لكثير من المستخدمين الذين لا يراعون 
قواعد الرسم الإملائي. 


۴ مراغاة ؤواقد الكلمة العربية (من السوابق واللواحق) 

:Affixes (Prefixes suffixs) 

فالكلمة فى العربية قن تكون خردة من السوايق واللواحق» وفك تلحقها السوابق 
واللواحق (كل على حدة أو كلاهما معا)» فكلمة (إيمان) جذع يقبل العديد من السوابق 
واللواحق» ومن صوره على سبيل المثال: الإيان - لإيان - للؤيان - فالويمان - 


حا لاحت 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


والإيهان- لإيمانه - لإيهانهم - لإيهانك - لإيمانكم... 

ومن السوابق حروف الجر المتصلة مثل الباء واللام وحروف العطف المتصلة مثل 
الواو والفاء» ومن اللواحق الضهائر المتصلة له. هم عها). 

وهذا المعيار يرتبط أيضا بضرورة مراعاة حالات إعراب الكلمة العربية المعربة 
بالحروف لا بالحركات» فالبحث عن كلمة مثنى ينبغي أن يتضمن البحث عن علامتي 
التثنية (ان) و (ين)» أي أن البحث عن «المسلمين» = البحث عن «المسلمان)» والبحث 
عن جمع المذكر السالم يتضمن البحث عن حالتيه الإعرابيتين (ين) » (ون) › أ أن 
البحث عن «المسلمين» - البحث عن «المسلمون). 

وكذا الأمر بالنسبة لألف التنوين بالفتحة فالبحث عن «مسلم» = البحث عن 
«مسلً)؛ » والبحث عن «إيمان» = البحث عن (إيانًا». 

ويمكن لمحرك البحث في هذه الحالة أن يقدم للمستخدم إمكانية الاستعاضة عن 
الحروف المتغيرة بالكلمة بالعلامة (٭) » على النحو التالي: 

فالبحث عن «المؤمن #دن» = البحث عن «المؤمنان» - «المؤمنين)» - «المؤمنون» 


25 - 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


المعايير اللغوية لتعامل محرك البحث مع كلمات البحث على المستوى 
الدلالي: 


:)572201171227( مراعاة الترادف‎ - ١ 

يعد معيار مراعاة الترادف آهم معيار دلالي من المعايير اللغوية لتقييم محركات 
البحث العربية» فمستخدم محركات البحث على الإنترنت لا يستخدم الصور المترادفة 
للكلمة المراد البحث عنهاء وهو ما يؤدي إلى فقد كثير من النتائج المفيدة له» بسبب عدم 
استخدامه لمترادفات كلمته. فالبحث عن كلمة ما في عر كات البحث لا يتضمن البحث 
عن مرادفاتها. 

ونقصد بالترادف هنا الكلات المختلفة التي تحمل دلالات واحدة» وذلك على 
مستوى الفصحى واللهجات. أو حتى الكلمات المعربة» ومنه على سبيل ال مثال لا الحصر: 

- البترول» النفط - حقول البترول » آبار البترول - حقول النفط - آبار النفط. 

- قوانين حمورابي » تشريعات حمورابي » شريعة حمورابي» تشريع حمورابي. 

- بنوك » مصارف - بنك - مصرف. 

- حاسب - كمبيوتر - حاسوب - بي سي. 

- هاتف نقال - محمول - جوال - موبايل - خليوي. 

- مباراة - ماتش. 

- فندق - أوتيل - هوتيل. 

ومن الترادف الواجب مراعاته لدى محركات البحث الصور المختلفة للكيانات 
والأعلام: 

الأمين العام للأمم المتحدة - سكرتير عام الآمم المتحدة - سكرتير الأمم المتحدة 
- بان كي مون. 

الولايات المتحدة - أميركا - الولايات المتحدة الأميركية. 

ومن الترادف الواجب مراعاته أيضا لدى محركات البحث الصور المختلفة للأعداد 
العربية وكتابتها بالحروف أو بالأرقام: 

فلا شك في أن من يبحث عن الأعداد بالأرقام سيفقد نتائج كتبت بالحروف. وأن 


الات 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


من سيبحث عن الأعداد بالحروف سيفقد نتائج كتبت بالأرقام» ومن ثم وجب على 
محرك التعامل مع الشكلين في حال البحث عن أيهم|. 

- أحاديث ال ٠‏ : النووية - الأربعين النووية. 

- ألف ليلة وليلة - ٠٠٠١‏ ليلة وليلة. 

- العالم سنة ٠٠٠۳‏ - العالم سنة ألفين وثلاثة. 


" - مراعاة المشترك اللفظى (110120127712277): 

وهو أن يكون للفظ الواحد أكثر من معنى دلالي» وينشأعنه اليس( عاط ۸)» 
ومثاله في العربية: العين» فهي في الأصل عضو الإبصار؛ والعين مكان يجري منه الماء؛ 
والعين: الوجيه في قوم» يقال: هو من أعيان الناس» والعين: الحسد؛ والعين مدينة في 
دولة الإمارات؛ وما إلى ذلك من معان أخرى. 

ويتعين على حرك البحث عند اكتشاف اللبس من خلال آلياته أن يعرض الخيارات 
المختلفة» موجها سؤاله إلى المستخدم؛ أي المعاني تقصد ؟ ومن الممكن أيضا أن يعرض 
المحرك بعض الكلمات المتعلقة دلاليًا بكلمة البحثء والتي من شأنها أن تزيل اللبس 
ف كلمة البخت. 

ومن ذلك البحث عن كلمة «العربية» -على سبيل المثال- فمن الممكن لمحرك 
البحث بعد اكتشاف اللبس في الكلمة أن يقترح بعض الحلول: 


اللغة العرية. 

قناة العربية. 

المرأة العربية (صفة). 
العربية (سيارة). 
وكذا كلمة الجزيرة : 
قناة الجزيرة. 

شبه الجزيرة العربية. 
جريدة الجزيرة. 


ومن الواجب هنا تحديد المعنى المقصود بواسطة المستخدم» ويقع العبء الأكبر بعد 
ذلك على محرك البحث في اختيار النتائج وعرضها تبعًا للمعنى المراد من قبل المستخدم. 


۳ 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


فالمعيار هنا إنما هو مدى تعامل المحرك مع قضية اللبس الدلالي من حيث اكتشافه 
وطرق تخلصه منه. 

۳- مراعاة اللبس الصرفي على مستوى كلات البحث وعلى مستوى 
كليات التوقف: 

أولاً: على مستوى كلمات الببحث: 

يظهر تأثي راللبس الصرفي جليًا في عر كات البحث على مستوى كلمات البحث”" إذ 
تتعدد التوجيهات الصرفية للكلمة الواحدة» فيكون لكلمة البحث الواحدة تحليلات 
صرفية متعددة ومن ثم تحليلات دلالية متعددة» فمن شأن المحرك عند البحث عن 
كلمة «الدين» - على سبيل المثال - أن يؤدي عمله كحاطب ليل» وذلك بأن يجمع كل 
سياق لكلمة «الدين» بتحليلاتها الصرفية المختلفة دون نظر لمراد المستخدم أو مقصوده. 
فالبحث عن كلمة «الدين» يحتمل العديد من المعاني والدلالات التي يمكن أن يقصدها 
ال العدايلات الضري رالا ها مدد ر كر ةما بين الصلان وال 
الجامد وكونها جزءًا من العلم في التركيب «علاء الدين»» كما يلي: 


الكلمة 5 1 1 0 . : 4 
ل السابق الجذع نوع الكلمة | الوزن الجذر تسم الكلم اللاحق 
Voweled‏ 
Tags Root Pattern Type Stem | Prefix‏ 205 | كناك 
Word‏ 
0 أل: مفرد مذكر 
هو : 1 : ا 
1 حالة التعريف 
5 أل؛ 5 مفرد مذكر 
الدين ¿ | اسم جامد | ذف ن فوع ؤ ج 
ا اسن فعل دي مرفوع في 


١‏ - راجع: اللبس في البنية والتركيب؛ أناطه وأسبابه وآثاره وطرق التخلص منه» دراسة نحوية حاسوبية في العربية 
المعاصرة» عمرو جمعة عبد الرسول» رسالة دكتوراه بكلية دار العلوم» جامعة القاهرة» ٠۲٠٠٤١‏ ص ۷٤‏ وما بعدها. 


غ85 - 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


الكلمة 5 : . 8 ١‏ . 1 
Voweled‏ 
Tags Root Pattern Type Stem Prefix ٣‏ 205 | كناد 
Word‏ 
الدَيْنَ التعرية دين | اسم جامد فَعْلَ دين منصوب في 
ال الت ين 
الذي د دين | اسمجامد | فِعللى | دين منصوب في | -- 
5 الال ا 
الدي ٠‏ | دين | اسمجامد | قعل ادي ن|مجرور فى حالة| ‏ -- 
> | تعربت | الف 
الدب الع به دين اسم جامد فعل دين مجرور في حالة e‏ 
١ 0‏ التعريف 
0 م 
3 جرء من 
الد 5 الد 2 9 0 0 
ين يوق 1 
علم» مثل: 
الدين اا دين | مصدر أصلي فعل دين مرفوع 5 
1 حالة التعريف 
الدين التعريف دين مصدر أصلٍ فعل دين مرفوع في 0 
حالة التعريف 
== 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


الكلمة 
البيئانة 
المشكولة ف 
Voweled‏ 
Prefix‏ 
Word‏ 
آل 
الدب“ 
| التعريف 
2 أل: 
الل“ 
|التعریف 
8 أل: 
الدب . 
> التعريف 
3 ا .9 
الدذن*٠‏ 03 
> التعريف 


جدول رقم )١(‏ لتحليل كلمة «الدين» بواسطة المحلل الصرفي «الخليل» 


جنع 


Stem 


نوع الكلمة 


Type 


مصدر أصلي 


مصدر أصلي 


مصدر أصلى 


مصدر أصلى 


الوزن 


Pattern 


5+ 


الجذر 


Root 


قسم الكلم 
POS Tags‏ 


مفرد مذكر 
منصوب ف 
حالة التعريف 


مفرد مذكر 
منصوب في 
حالة التعريف 


مفرد مذكر 
مجرور في حالة 
التعريف 


مفرد مذكر 
مجرور في حالة 
التعريف 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


Suffix 


ومن ذلك أيضا استخدام محركات البحث في البحث عن كلمة «العلم» التي تحتم| 
من المعاني الصرفية والدلالية ما يلي0"©: 


الكلمة 
المشكولة 
Voweled‏ 
Word‏ 


5 


الْعَلَمَ 


نوع الكلمة 


Type 


اسم جامد 


اسم جامد 


اسم جامد 


اسم جامد 


اسم جامد 


اسم جامد 


الوزن 


Pattern 


لجذر 


Root 


ع لم 


ع لم 


ع لم 


ع كام 


ع كام 


قسم الكلم 
POS Tags‏ 


مفرد مذكر 
مرفوع في 
ا 
مفرد مذكر 
مرفوع في 
حالة اعرف 
مفرد مذكر 
منصوب في 
خالة ی 
مفرد مذكر 
منصوب في 
اال 
مفرد مذكر 
مجرور في حالة 
التعريف 
مفرد مذكر 
مجرور في حالة 
التعريف 


١‏ - راجع: اللبس في البنية والتركيب؛ أناطه وأسبابه وآثاره وطرق التخلص منه؛ دراسة نحوية حاسوبية في العربية 
المعاصرة» عمرو جمعة عبد الرسول» ص ۷۷ وما بعدها. 


دا 2 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


الكلمة 
المشكولة 
Voweled‏ 
Word‏ 


الْعَلَمَ 


الْعَلَمَ 


السابق 


Prefix 


الجذع نوع الكلمة 


Type Stem 


علم | مصدر أصلي 


علم | مصدر أصلي 


علم | مصدر أصلي 


علم | مصدر أصلي 


علم | مصدر أصلي 


علم | مصدر أصلي 


علم | مصدر أصلي 


علم | مصدر أصلي 


الوزن 


Pattern 


ب 


Root 


ع لم 


ع لم 


ع لم 


ع لم 


ع كام 


ع كم 


ع كم 


قسم الكلم 
POS Tags‏ 


مفرد مذكر 
مرفوع في 
ال ا 
مفرد مذكر 
مرفوع في 
خا التعررات 
مفرد مذكر 
مرفوع في 
خالة العف 
مفرد مذكر 
منصوب في 
ا ارات 
مفرد مذكر 
منصوب في 
حالة التعريف 
مفرد مذكر 
منصوب في 
عا الت 
مفرد مذكر 
مجرور في حالة 
التعريف 
مفرد مذكر 
مجرور في حالة 
التعريف 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


المشكولة 


Voweled 
Word 


الْعلْم 


نوع الكلمة 
Type‏ 


مصدر أصلى 


الوزن 


Pattern 


5 


لجذر 


Root 


ع لم 


قسم الكلم 
POS Tags‏ 


مفرد مذكر 
مجرور في حالة 


التعريف 


جدول رقم (۲) لتحليل كلمة «العلم» بواسطة المحلل الصرفي «الخليل» 


اللاحق 


ومنه أيضا البحث عن كلمة «التهم» التي تحتمل الاسم والفعل في الوقت نفسه وفقا 
لتحليلات الصرفية على محلل الخليل الصرنفي': 


المشكولة 


Voweled 
Word 


Prefix 


لجع 


Stem 


نوع 
الكلمة 


Type 


الوزن 


Pattern 


و و 


الجذر 


Root 


كدوم 


ج 


اللاحق 


Suffix 


١‏ - راجع: اللبس في البنية والتركيب؛ أناطه وأسبابه وآثاره وطرق التخلص منه» دراسة نحوية حاسوبية في العربية 
المعاصرة» عمرو جمعة عبد الرسول» ص ۸١‏ وما بعدها. 


قاع 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


السا 
المشكولة 
Voweled‏ 
Prefix‏ 
Word‏ 
هو أل: 
ال 
لتم التعريف 


افلم 


Stem 


التهم 


ا 


نوع 
الكلمة 


Type 


فعل أمر 


الوزن 


Pattern 


وم 


افتیل 


Root 


لخادم 


لهم 


قسم الكلم 
POS Tags‏ 


جمع تكسير 
مجرور في حالة 
التعريف 


ثلاثي مزيد 
مسد إل 
الغائب (هو) 
متعل 


ثلاثي مزيد 
مسد إل 
الغائب (هو) 
متعل 


ثلاثي مزيد 
ساف ل 
المخاطب أنت 
متعل 


جدول رقم (۳) لتحليل كلمة «التهم» بواسطة المحلل الصرفي «الخليل» 


ثانيا: على مستوى كلمات التوقف: 
فإن من المتفق عليه في نظم البحث والاسترجاع أن يتم استبعاد بعض كلمات 
البح عند اله يعملية الح وذلك لقدم د الها عل سان ى سعد اها 
وللإسهام في الإسراع بعملية البحث» وهي ما يطلق عليها كلمات التوقف (5]00 


١‏ - مالم توضع مع كلمات أخرى بين علامتي اقتباس“ ” ومثاله: ”ليلة في حب مصر“. 


کے 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


اللاحق 


Suffix 


5 أو کلات الاستبعاد» وهى كلات تتكرر كثيرًا في النصوص» ومن أمثلتها: 
الضائر» وحروف العطف» وحروف ال جر. وتسعى معظم نظم استرجاع المعلومات 
النظم أساليب إحصائية لتحديد أكثر هذه الكلمات شيوعًا من حيث استخدامها. ففي 


الإنجليزية - على سبيل المثال - تسع عشرة كلمة تتوزع بين أدوات التعريف وحروف 
الجر والعطف» وهى: (,2 no, into, in, for, by, but, at, ,as, 220 an, a”,‏ 
(us to, the, 5 on, of, not,‏ ’“ 
أما كلمات التوقف في العربية» فيمكن أن تشمل حروف المعاني» وأسماء الإشارة» 
والأسماء الموصولة» وأدوات الشرطء وأدوات الاستفهام, ... إلى آخر هذه الكلمات”". 
ويتجلى تأثير اللبس الصرفي في نظم استرجاع المعلومات عند استخدام كلمات ملبسة 
ضمن كلمات التو قف «11701005 »)50p‏ فكلمات مثل: (بين»؛ «(عن»» ١من»»(على‏ )”2 


12110116 راجع: قواعد البيانات المحملة على الأقراص المدمجة: دراسة حالة لقاعدة بيانات الإنتاج الفكري الإسلامي‎ - ١ 
عدد ۲ (رجب_ذو الحجة‎ » ٦ هاشم فرحات» مجلة مكتبة الملك فهد الوطنية » مجلد‎ » SLAMS ON CD-ROM 
على الرابط‎ ”٠ ۱ه / أكتوبر ١٠٠٠_مارس ۲۰۰۱م)» ص‎ 

http: / /faculty.ksu.edu.sa /Alhendawy /My/.20publications //D9/.82/D97/.s8/D8/.A71.D8 
/B9/Ds/AF/.20/D8s/A71.D91.84/Ds/A81/D91/.8A1/Ds1.A71D91.86/Ds/.A71Ds/AA.pdf 
:12= 12-2013 

۲ - تتوافر على الشبكة العالمية للمعلومات (الإنترنت) بعض المصادر المفتوحة التي أعدت قائمة بكلمات التوقف العربية 
ومنها موقع عرب آيز (وهو موقع تشاركي مفتوح للجميع دون قيود» يوفر مناخا للنقاش وتبادل الخبرات والمعرفة حول 
اللغة العربية ولسانياتها وما يتعلق بدعمها والارتقاء بها في الحوسبة بشكل عام» والبرمجيات الحرة على وجه الخصوص). 
وتحتوي القائمة - التي أطلق عليها «مستبعدات الفهرسة» - 1۷١‏ كلمة توقف تشمل: الاتجاهات» وأدوات الاستثناء» 
وأسماء الإشارة» وأسراء الاستفهام» وأسماء الشرطء والأساء الموصولة» والحروف الأبجديةء وأسماء الشهورء وأسماء 
الأصوات. وأساء الأعداد» وأساء الأفعال» والأساء الخمسة» وأفعال التعجب. والأفعال الخمسة» وأفعال القلوب» 
وإن وأخواتهاء وأدوات التوكيد» والكلات الجامدة» وحروف العطف المنفصلة» وبعض الحروف والإشارات» وبعض 
الحروف والأفعال والأدوات» والضائر المتصلة المجرورة والمنصوبة» والضائر المنفصلة» والظروف» وأساء العملات» 
وكاد وأخواتهاء وكان وأخواتهاء والأفعال المتعدية لمفعولين» والأفعال المتعدية لثلاثة مفعولات» وأدوات المدح والذم» 
والمشبهات بليس» وبعض المنصوبات» ولا النافية للجنس» وأساء الأيام. مع إضافة القواعد اللغوية لتوليد هذه صور 
الكلمات مع سوابقها (العطف والجر والاستفهام والتعريف) ولواحقها (الإضافة أو الإسناد للضائر والتصريف 
والاشتقاق) والتي بلغ عددها )١11701(‏ صورة. 

راجع: الرابط في ٠٠١9/17/17‏ 

/Wiki.arabeyes.org‏ / :ttpا/‏ مستبعدات_الفهرسة 


۳ - حرف الجر «على» قد يلتبس مع العلم (عََ) في الكتابة المصرية فقط» ومن هنا فاللبس فيها يقتصر على الكتابة المصرية» 


5 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


«قبل)» «بعد)» عبر )» «غير)» «(مه|)» «ظل)» «هم)» «حول)» «دون)» «قد)"'' لها تحليل 
صرفي آخر مغاير لكونها من كلمات التوقف» ومن ثم فإن تضمينها كلمات التوقف أمر 
غير دقيق لغوياء ويؤدي لتجاهل العديد من النتائج المهمة في البحث. 

فكلمة مثل «قد» - على سبيل المثال -يمكن أن يكون من تحليلاتها الصرفية مايل" : 


المشك لد السابق الجذع نوع الكلمة الوزن الحذر قسم الكلم اللاحق 
Voweled‏ 


Suffx | 205 Tags Root | Pattern Type Stem | Prefix 
Word 


مفرد مذكر 
مرفوع 
ف حالة 
الإضافة 


ماع 
¥ 
ماع 

لل 


3 
1 
1 

ع 


اسم جامد 


3 
6 
2 


A 
+ 
e. 
1 
1 
5 


اسم جامد 


1 

1 

3 

6 
e: 


2 
1 
1 
00 


اسم جامد ذ ف دد 1 3 


1 
1 
! 
ع 
3 
ع 
1١‏ 


35 
1 
1 

3 


اسم جامد ذ ف دد 1 3 


أما الكتابة الشامية فتستخدم الياء ا منقوطة (ي) للتفريق بين الياءين (عَيَ). 


١‏ - راجع: اللغة بية 3 > > دراسة لغوية بية من واقع ذخيرة لغوية» هبة سيد راشد» 
راجع: اللغة العربية المعاصرة في المجال السياسي» دراسة لغوية حاسوبية من واقع ذخيرة لغوية» هبة سيد را 
رسالة ماجستيرء كلية الألسن» جامعة عين شمس»٠ 7١١8‏ ص /0. 


۲ - راجع: اللبس في البنية والتركيب؛ أنماطه وأسبابه وآثاره وطرق التخلص منه» دراسة نحوية حاسوبية في العربية 
المعاصرة» عمرو جمعة عبد الرسول» ص *۷ وما بعدها. 


امم 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


- 


03 
4١ 


3 


ع 
N‏ 


3 


A 
لل‎ 


3 


السابق 


Stem | Prefix 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


نوع الكلمة 
Type‏ 


اسم جامد 


مصدر أصلى 


مصدر أصلى 


مصدر أصلى 


الوزن 


Pattern 


ع 
1 


ماع 
¥ 


0 


0 


A 
1 


ع 
N‏ 


ع 
¥ 


A 
¥ 


سس 


الجذر 


Root 


قسم الكلم 
POS Tags‏ 


مفرد مذكر 
جرور نكرة 


مفرد مذكر 
مرفوع 
في حالة 
الإضافة 


مفرد مذكر 
مرفوع نكرة 
مفرد مذكر 
موو 
في حالة 
الإضافة 
مفرد مذكر 
ججرور 
في حالة 
الإضافة 


مفرد مذكر 
بجرور نكرة 


اللاحق 


Suffix 


المشكولة 


Voweled 
Word 


A 
0 


5 


ص 


A 
0 


5 


0 


E 


Prefix 


Stem 


فعل أمر 


فعل أمر 


فعل أمر 


فعل أمر 


الوزن 


Pattern 


0 


A 


2 


ص 


A 


26 


ا 


غم 


الجذر 


Root 


ف و د 


POS Tags 


ثلاثى مجرد 
و 

الغائب(هو) 
متعل 


ثلاثى مجرد 
مسد إل 
المخاطآب 
أنت متعد 


ثلاثى مجرد 
مستد إل 
المخاّآب 
أنت متعد 


ثلاثى جرد 
سند إل 
المخاّآب 
أنت متعد 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


Suffix 


الكلمة 
المشكولة 
Voweled‏ 
Word‏ 


السابق الجذع نوع الكلمة 
Type Stem | Prefix‏ 


حرف تحقيق 
وتقريب 


الوزن 


Pattern 


Root 


قسم الكلم 


POS Tags 


جدول رقم (5) لتحليل كلمة «قد» بواسطة المحلل الصرفي «الخليل» 


اللاحق 


Suffix 


وهي الاحتمالات الصرفية التي يصعب معها عدّها مع ما يشبهها من كلمات التوقف 
التي يجب على محلل البحث ذي السمات اللغوية العربية إهمالها عند فهرسة النصوص 
العربية والبحث فيها. 

والخلاصة أن البحث عن إحدى هذه الكلمات الملبسة صرفيا باستخدام حر كات 
البحث يقلل من حجم النتائج الصحيحة لعملية البحث حيث تحتمل الكلمة حينئذ 
العديد من المعاني التي تتسبب في إخراج المحرك للعديد من النتائج غير الدقيقة؛ 
لاختلاف التحليلاات الصرفية لكليات البحث هذه. ولذا يمكن اعتبار مدى مراعاة 
محرك البحث للبس الصرفي والدلالي معيارًا مهيا من معايير تقييم هذا المحرك 


والحكم عليه. 


»»64»© 


ا 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


المبحث الثالث 
المعايير اللغوية والفنية لتقييم برامج التعرف الضوئي على الحروف العربية 


- 


تمهيد: 

تعد غملية وقمتة مضادر العلومات العربية أمرًا بالغ الأهية؛ إذ رل من خلاها 
نصوص مصادر المعلومات الورقية إلى شكل إلكتروني قابل لعمليات المعالجة الآلية 
وذلك من خلال المسح الضوئي للنصوصء ومن ثم الوصول إلى نسخة إلكترونية 

بقة تماماً للنص الأصلي الموجود في صورة ملفات هم[ . أو 46م. على سبيل 
المثال. 

ومع ازدياد الحاجة إلى رقمنة مثل هذه الملفات» من خلال التقنيات المتخصصة في 
التعرف الضوثئى على الحروف OCR» Optical Character Recognition‏ “ زادت 
اناج إن ديد ساب N‏ ده لبر اسيم 

والمبحث الذي بين أيدينا يرسم خطوطا عريضة للمعايير اللغوية - على وجه 
الخصوص - لتقييم مثل هذه البرامج» وتتباين هذه المعايير ما بين الفنية واللغوية؛ 
فالفنية منها تحص شكل ال حرف العربي وأنواع خطوطه المختلفة سواء باليد أو بالآلة 
الكاتبة» أما المعايير اللغوية فتخص الجانب اللغوي للحروف العربية من حيث اتصاها 
وانفصاها والبدء بها أو الانتهاء بهاء إضافة إلى ضبط الحروف العربية بالشكل في 
المستوى الكلاسيكي منهاء وهذا ما يزيد من تعقيد عملية التعرف على الحروف العربية» 


۳ 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


ومن المعايير اللغوية كذلك مدى استخدام القواعد اللغوية في التعرف على الحروف 
العربية» أو استخدام آلية لغوية لتصحيح الأخطاء اللغوية في التعرف. وقبل أن نشرع 
في تفصيل هذه المعايير» نعرض أولا لمشكلات التعرف على الحروف العربية. 


مشكلات التعرف على الحروف العربية» وتكمن في: 

الكتابة المتصلة للحروف العربية: حيث تتميز العربية بكتابة حروفها متصلة غير 
منفصلة مثل الإنجليزية مثلآء ومن ثم يصعب التعرف عليها نتيجة لتداخلها. 

نقط الحروف أو الإعجام: تشترك نصف حروف العربية في نقط الحروف أو 
إعجامهاء فالنقط مهم جدا في الأبجدية العربية» وذلك أنه يفرّق بين الحروف» والعرب 
قديًا كانوا يطلقون عليه الإعجام أي إزالة الغموض ويآأتي في مقابله الإهمال» فالحروف 
إما مهملة أو معجمة. ولكن هذا النقط أو الإعجام يمثل صعوبة كبيرة عند عملية 
التعرف الآلي على الحروف العربية لتشابه الكثير من الحروف العربية في النقط. فالحروف 
العربية (ج»حءخ).» لا يكاد يفرق بينها إلا التنقيط» فحروف كالجيم والحاء والخاء تكتب 
هكذا (ح) مع اختلاف وضع النقطة على الحرف أو عدم وضعهاء وهو ما يضاف إلى 
صعوبات التعرف الآلي على الحروف. 


والجدول الآتي يرصد بعض صور هذه الحروف واحتمالاتها عند الرسم الكتابي: 


احتمال ١‏ باات ج د ر اش لصا طا ع | فا هاي 
احتمال ۲ د ان اها ذا اا اك اعفد انظ ا مغ | عق | ےه ئ 
احتهال ۳ 8 ت ف اع 
احتمال ٤‏ سے سك 


جدول رقم (5) يوضح بعض صور الحروف المعجمة والمهملة في اللغة العربية. 


الضبط بالشكل: تتميز العربية بالتعبير عن الأصوات بحركات التشكيل» وتأتي هذه 
الحركات مقابلة للصوائت في اللغات الأخرى (6-0-1).: فحركات الكسرة والضمة 


ام 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


والففيحة والسكون ( ”> “> *) كلها علامات على الصوائت وأدلة على وجودها. 
رعا يحور الكلية العربية الكفير من الزوائد الشكلية اعدا من قط اروف واتعياة 
بحركات الضبط بالشكل. 

الخطوط الفنية الزخرفية (كوفي - أندلسى - فارسى - ...): تتميز العربية بإمكان 
كتابة حروفها بعدد من الحروف الزخرفية: التي تضيف إل الصعوبات السابقة امتعلقة 
بخصائص الحروف العربية صعوبة أخرى. 

تغير أشكال ا حروف العربية بتغير مواقعها وتغير أشكاها بتغير نوع الخط المكتوبة 
به فحرف (س) على سبيل المثال يكتب في أول الكلام (س) وفي آخر الكلمة (س) وفي 
وسط الكلمة (س)» وكذا يختلف شكله بخط النسخ عنه في حال خط الرقعة. 

ينبغي كذلك أن نوضح أن ثمة مستويين للنصوص العربية المعالجة» أوها مستوى 
النصوص غير المضبوطة بالشكل» وهي نصوص بسيطة. وثانيها مستوى النصوص 
المضبوطة بالشكل» وهي نصوص معقدة. 


أما المعايير اللغوية والفنية لتقييم برامج التعرف الآلي على الحروف العربية فهي على 
النحو الآتي: 


المعيار الأول: 

التعرف على جميع حروف الخطوط العربية المستخدمة فى الكتابة العربية» ولذا يقترح 
الباحث مجموعة من المصادرء لتكون مصادر خطوط نموذجية للنصوص العربية (من 
حروف» وأرقام» وعلامات تشكيل» وعلامات ترقيم) لاستخدامها في عملية تقييم 
عملية التعرف الآلي على الحروق العربية؛ إذ يجب أن تضم: 

)١(‏ مجموعة من خطوط اليد لمجموعة متفاوتة في السن وفي التعليم. 

(۲) مجموعة مختلفة الخطوط من الصحف وال جحرائد في شتى أنحاء الوطن العربي. 

(8) دات مکو غل الآلة الكالية: 

)٤(‏ نصوص لخطاطين بشتى أنواع الخط العربي غير الزخرفية. 

(5) نماذج من خطوط (الأوفيس) غير الزخرفية. 

(0) تنسيقات مختلفة لصور الخطوط السابقة جميعها. فاحتواء النص على تنسيقات 


رم 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


غاية في التعقيد -مثل: (وجود عدة أعمدة رأسية» ووجود إيضاحات أو هوامش أو 
حواش في أماكن غير منتظمة» وغير ذلك)- سيكون له تأثير سلبي على جودة التعرف 
الضوئي على الحروف. 

(۷) نصوص متعددة اللغات أو متعددة الرموز أو الحروف (حروف وأرقام 
متداخلة» أو تداخل العديد من اللغات في النصوص التي تحوي أكثر من لغة). 


وسنحاول في الصفحات القليلة القادمة التمثيل لكل من النماذج السابقة: 
(1) مجموعة من خطوط اليد لمجموعة متفاوتة في السن وني التعليم. 


كك عو 
شوح سبو عار عله ليع وو 


١ 
3 n © 1 اانه 5 م‎ O 5 ٤ 
كن 8 س جا مع ان اكشمة عن رمسق» > رون أن ھرس الا سین‎ 
. عفى ]صلا بع‎ 
تو کی 2 2 ت‎ 5 
ودر #سحطيع إن ونطى اسل > ودعت نتف غ بعصس‎ 
دوہ ج ِء 5 5 ا‎ 
١ السمسي + ا والرھان + والتوت › و‎ 


5+ سد جيل‎ 51 1 ١! 
0 530 مها‎ 

فا له هم دیا چ 

د کے 

e IE 

= 
2 
( 


شكل رقم (۲) يمثل نموذجا لخط اليد 


5 0-7 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقيا أو تداولها تجارياً - 


(۲) مجموعة ختلفة ال مخطوط من الصحف والجرائد في شتى 
اتون 


O‏ ؤي حو للحم 


لح ركان عن حو اے سروينا ات تح 
الى مر حوعسج لے ر الس كلاخ للحت 
فقمتيءت اہ - سال لٹ حرم یل 
EL‏ قت یوت سا 5 


€ سے 


شكل رقم (۳) يمثل نموذجا لخط اليد 


حم خر دا عر عدي 


وقالت المصادر إن الجيش الباكستانى اعتقل «أبودحانة» أثناء السملة 
التى قامت بها قرات الجيش على منطقة القبائل فى وادى سوات الشهور 
الماضيةء مشيرة إلى مشاركة بعض أحهزة الاستخبارات الأحنبية والعربية 


طى تلك الحملة 


شكل رقم (5) يمثل نموذجا لخط إحدى الصحف العربية 


الخليل رفا بقاه بحمو عه فن الشباب 
الفلسطينيين من الضفة الغربية وقطاع غزة 
والشتات: تنفيذ مشروغ اكبر علم - 
في العالم بطول ٠٠١‏ متر وعرض ++ هترا 
ربزئة طنين. حيث سيسجل هذا العلم ضمن 
الأرقام القياسية في موسوعة " غيئيس* 
العالمية. 

ولفت جلال مخارزة؛ رئيس غرفة تجارة 
جنوب الخليل إلى أن فكرة تنفيذ هذا الشروع 
جابت عبر مجموعة من الشباب في الداخل 
والخارج ( نحو ٠١‏ نابا وشابة ) يتواصلون 
ببعضهم عبر شبكة المعلومان المنكبوتية 
“الإنترنت. 

وأوضح أنه عندما طرحت هذه الفكرة 


الأعمال المساعدة في دعم هذه الفكرة التي 
تعتبر سابقة؛ فيما يتعلق بالآرقام السجلة 
في موسوعة ” غينيس * حول أحجام أعلام 
دول العالم المختلفة: إذ أن هذا العلم سوف 
يكون بمئابة إنجاز فنسحليني يلقت الانتباد 
إلى القضية والشروع التحرري الفلسطيني 
واثبات للذات. 

واعتبر مخارزة. "ان ذلك هو ضمن 
امساعدات التي تقدمها غرفة تجارة جنوب 
الخليل لتفعيل دور الشباب في الجتمع 
ومساعدتهم في الهروب من أجواء البطالة وقلة 
فرص العمل وايجاد وسائل ومشاريع يمكن من 
خلالها أن يعبروا عما يمتلكونه من قدرات 
مختلفة: )ضافة إلى أنه نوع من شد الانتباه 


کرم لساب تاا 
في طريفه إلى موسوعة , فیذیس) للأرام الفياسيه 


الفلسطينيين في لبنان وذلك للفت الانتباه 
لعاناة اللاجنين في مخيمات الشنات وما 
يعانونه من ظروف معيشية سعبة للفاية 
والتفكير في الأسباب الني أدث الى طردهم 
من وطنهم واللجوء إلى الخارج. 

وأضاف أنه سيتم عرض العلم كذلك في 
بعض الدول العربية والأجنبية: علما بأن 
هذا العلم يحتاج لنحو ٠٠١‏ شخص لحمله 
والسير فيه لاهتا إلى أنه تم الاطلاغ على 
الأرقام القياسية السجلة لدى موسوعة 
غينيس * بهذا الخصوص: حيث تبين أن 
الرقم القياسي السجل لأكبر علم في العالم 
هو علم البرازيل ولكن بحجم أقل من العلم 
الفلسطيني المزمع إنجازد. 


شكل رقم (0) يمثل نموذجا خط إحدى الصحف العربية 


f) 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


أنحاء الوطن 


توجه لاختيارابو مازن رئيسا للحركة بالتزكية.. تمديد الاجتماعات الى الثلاثاء 
مؤنمر فتح يشهد نقاشا ‏ أكثر من عاصف, حول سقوط غزة: 
دحلان ينبادل الاتهامات مع فريع ويحمل القيادة المسؤولية كاملة 
شكل رقم (5) يمثل نموذجا خط إحدى الصحف العربية 


الدوحة - إيمان الشمري 
ضمن فعاليات يوم الكناب العالمي المقامة في مدرسة 
قطر الإعدادية نظم أخيرا معرض للكتاب في القاعة 
الرياضية للميرسة المغرض أقيم لتعزيز ثقافة 
الفتيات وتشجيعهن على حب القراءة والاطلاع 
لفوائده الكبيرة في بناء وصقل الشخصية المثقفة 
وتماشبا مع رسالة المدرسة التي من ضمن أهدافها 
الرئيسية بناء الشخصية المثقفة الواعية المتوازئة. 
يوم الكتاب العالمي كانت له اصداؤه الواسعة وكان 
حقا أن تقام له فعالية على ارض الإبداع ارض قطر 
الإعدادية. 


للعرض حديقة غنا بزهورالثقافة 
كانت دور النشرالمشاركة بكتبها كالاتي. دار قطري بن 
الفجاءة دار الثقافة للنشر والتوزيع ومكتبة الثور. 


أما تنوع الكتب فكان محيرا لبعض الزوار الذين 
اعتبروا التجول بين اركان المعرض بمثابة المرور 
بحديقة غناء يحتار القارئ مانا بنتقي وماذا بتركا 
كانت أغلب الكتب التي لاقت قبولا هي الكنب الدبنية 
للمشابخ المعروفين أمثال الدكتور محمد العريفي 
وغااض القرزني وكذلك الكتب التطودرية والتغليمية 
للطالبات وكتب تعليم الطبخ والروايات الإنجليزية 
المترجمة للعربية أمثال قصص الكاتبة «أجاثا 
كريستي» البوليسية والروابات العربية للكتاب 
العرب أمثال نجيب محفوظ قد لاقت إقبالا كبيرا من 
الزوار من المدارس الثانوية 


الفعالبات الصاحبة 
أقيمت فعاليات مصاحبة للمعرض مثل ورشة «كيف 
أصنع ببدي» من إعداد الطالدات, تهدف إلى تعليم 
الطالبات كيفية صنع بعض المشغولات البدوية 


المقيدة في حياتهناليومية مثل نزيين الرفاتر والملفات 
والادوات المكتبية. كما كان هناك ركن للماكولات 
الشعبية والمشروبات السريعة للزوار 


للشعر نكهة مميزة شاعرية. 

عبق المشاعر وصرقها الذي ترجم إلى كلمات شاعرية 
أصبحت قصائد اضافت نكهة رائعة لأجواء المعرض. 
حيث أحييت الطالبنان الموهوبتان شعريا جفلة 
المضاحكة وهيفاء الكواري من الصف الثالث الإعدادي 
أصبوحة شعرية رائعة. بدات بالثعريف عن انفسهن 
ومن ثم إلقاء قصائد شغرية قرات الموهوبة جفلة 
أولا قصيدة عن قطر ذكرت فيها تاريخ قطر المجيد 
وإنجازات الشبخ حمد ال ثاني ونهضتها المميزة بين 
الدول الباقية. 

أما الطالبة هيفاء الكواري فقد انفردت بقصيدة مميزة 
عن الاصحاب والأصدقاء تحدثت بها عن منظورها 


شكل رقم (۷) يمثل نموذجا لخط إحدى الصحف العربية 


(۳) مستندات مكتوبة على الآلة الكاتبة. 


إذا كان الخط حسن الوصف» مليج الرصف» مفتوح العيون» أملس المتون» كثير 
الإئتلاف. قليل الإختلاف. هشت إليه النفوس» واشتهته الأرواح» حتى إن الإنسان 


لبقرأه ولو کان فيه كلام ردیء» ومعنى ردىء مستزيد فيه ولوكثرء من غبر سآمة 
تلحقه وإن كان الخط قبيحاء مجته الأفهام ولفظته العيون والنفوسء وسئم قارئه 
وإن كان فيه من الحكمة عجائبها ومن الألفاظ غرائبها. (7؟) 


شكل رقم (۸) يمثل نموذجا لخط الآلة الكاتبة 


€ 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


)٤(‏ نصوص لخطاطين بث 


الخط الرقعى 


ا 


و 


بشتى أنواع الخط العربي غير الزخرفية: 


وى .. 


مد عه مت سه 
عة الوكائ 2 5 


کرو 


را 7 3 


OFA 


ا 


a 
E OT 


شكل رقم (9) يمثل نموذجا لخط الرقعة مضبوطًا بالشكل 


(5) نماذج من خطوط الأوفيس غير الزخرفية. 


بسم اله الرحمن الرحيم 
يسم اله الرحمن الرحيم 
بسم الله الرحمن الرحيم 


يسم الله الرحمن الرحيم 


بضع الل الرحمن | 


حيم 

بسم الله الرحمن 
الرحيم 

بسم الله الرحمن الرحيم 


يسم الله الوحمن الرحيم 
يسم آله الرحمن الرحيم 
يمه الله الرحمس الرحيو 


Office fonts 


Microsoft Uighur 


Monotype Koufî 
Mudir MT 
Simplified Arabic 


Simplified Arabic 


| Fixed 


Tahoma 


Times New Roman 


Traditonal Arabic 


Akhbar MT 
Andalus 


بسم الله الرحمن الرحيم 
سم الله الرحمن الرحيم 
بسم الله الرحمن الرحيم 
بسم الله الرحمن الرحيم 
يسم الله الرحمن الرحيم 
بسم الله الرحمن الرحيم 
بسم الله الرحمن الرحيم 
بسم اله الرحمن الرحيم 
يسم الله الرحن ارم 


بسم الله الرحمن الرحيم 


نماذج من خطوط الأوفيس غير الزخرفية. 


DecoType Naskh 


DecoType Naskh 
Extensions 
DecoType Naskh 
Special 
DecoType Naskh 
Swashes 
DecoType Naskh 
Variants 


DecoType Thuluth | 


Farsi Simple Bold 
Farsi Simple 
Outline 

Arabic Typesetting 


Arial 


جدول رقم (5) لخطوط الأوفيس الزخرفية منها وغير الزخرفية 


- هذه الطبعة إهداء 


= 


من المركز ولا يسمح بنشرها ورقيا أو تداولها تجاريا - 


(5) تنسيقات ختلفة لصور الخطوط السابقة حيعهاء فاحتواء النص على 
تنسيقات غاية في التعقيد - مثل (وجود عدة أعمدة رأسية» ووجود إيضاحات أو 
هوامش أو حواش في أماكن غير منتظمة» وغير ذلك)- سيكون له تأثير سلبي على 
جودة التعرف الضوئي على الحروف. 


جا عو + جا م ع ٣‏ جا ج (س + و) جنا ! (م - و) 
جتا حو + جتاى = ١‏ جتالم (سو + ۶ ) جتا + (ح - ی) 
جا حو جا و = ٣‏ جتا ل ر + و) جال (ح - و) 
جتا و او ت۲ ا ! وس + و)جا (<ح-ى) 
بذالامر ص بلاس عي عن 
>" ظا 
١‏ ظا" 
جنا 7 سو = بجنا" سڪ جا" سو 
= ۲ جا" ١‏ 
ا جا" 


ظا 7 سور = 


شكل رقم )1١(‏ يمثل نموذجا لاحتواء النص على تنسيقات غاية في التعقيد 


(0) نصوص متعددة اللغات أو متعددة الرموز أو الحروف 
(حروف وأرقام متداخلة » أو تداخل العديد من اللغات في النصوص التي تحوي 


E 
identification كيين الهوية أو الشخصية‎ 


to ignore, disregard, overlook, be unmindful ته ی عن‎ 


alimented; to feed on, live on; to eat; to be fed 
(with), charged (with), provided (with), supplied 


شكل رقم )١١(‏ يمثل نموذجا لاحتواء النص على نصوص متعددة اللغات أو متعددة الرموز أو الحروف. 


(with) 7 

nutritional تغذوي‎ to wrong one another; to cheat one another ابن‎ 5 
nutrition, feeding, nourishment, ( تغديه (شَخصٍ‎ ¦ 10 court or woo عمه‎ another; to flirt with one ازل‎ 
nourishing, alimentation another 

تفاض (الَقاضي) overlooking, disregard(ing), (jz)‏ عر يه (آلة 7 0 ن ن إلخ) feeding), charging; providing‏ 


condonation, connivance, winking at, blinking at, 
shutting one's eyes to; excuse, forgiveness, 
pardon(ing) 8 
to overlook, disregard, condone, C01iVê تغاضى عن‎ 
at, wink at, blink at, bypass, pass over, let pass, 
shut one's eyes to; to excuse, forgive, pardon 
to close one's eyes تفاضی عينه أو عينيه‎ 
ا ا‎ 
تغافل عن - راجع أغفل‎ 
to feign ممأكمعالهما‎ Or inadver- تَمَاقَلَ: تَظَاهَرَ بالغفلّة‎ 
tence, feign negligence or carelessnéss, pretend to 
be inattentive or inadvertent, pretend to be negli- 
gent or careless 


with, supplying with 


feedback عدي ةا ا أو راجعة‎ 
dietetics, sitology ع اندب‎ 
to be glued, fixed with glue, conglutinated, تفرّی‎ 


agglutinated; to conglutinate, agglutinate 

تقرَ: ترح هاج - راجع ترب 
مرب - راجع اغْتِراب 

to sing, warble عرد :عرد‎ 

to take sides with, side with, be partial عرض ل نك :تحير‎ 

to, be biased for, have a bias for 


ماع 


- هذه الطبعة إهداء 


من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


المعيار الثاني: 

التعرف على علامات الضبط بالشكل (علامات التشكيل) والتفرقة بينها وبين نقط 
الإعجام: 

تتميز اللغة العربية بالتعبير عن الأصوات (7077615) بحركات الضبط» وتأتي هذه 
الحركات مقابلة للصوائت في اللغات الأخرى (6-0-1-0-2)» وهكذا يعتور الكلمة 
العربية الكثير من الزوائد الشكلية من تنقيط الحروف وحركات الضبط بالشكل. 


تنوين 2 تنوين 1 تنوين 
فتحه صمه 0 
بالفتحة | ل ا اسن 
۽ . . | شلةوتنوين ٠‏ , 0 2 | شلةوتتئوين | ىا . | شدة وتنوين 
سدة وفتحه شسدة وضمه سك 
7 بالفتحة 7 بالضمة sS‏ 


جدول رقم (۷) لعلامات الضبط بالشكل في العربية 


والحق أن اللغة العربية المعاصرة لا تستخدم علامات الضبط بالشكل في النصوص 
المعاصرة» ومن ثم يمكن مراعاة هذا المعيار في النصوص الكلاسيكية وحسب» وتجاهله 
في النصوص المعاصرة. 


المعيار الثالث: 
التعرف على الأرقام العربية بصورتيها؛ الهندية ١‏ - ؟ - ۴ - والعربية -3 -2 -1 ... 


المعيار الرابع: 

التعرف على علامات الترقيم ( - . - ؛ - ؟ - ! ). ومن المهم هنا الانتباه إلى أن هذه 
العلامات قد تتصل بالكلمة تارة وقد لا تتصل بها تارة أخرىء ومن ثم ينبغي معالحة 
هذه العلامات في كلتا صورتيها. 


کک 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


0]... E التخدادة ره‎ STE 


المعيار السادس: 
التعرف على الصور والأشكال الرسومية» ونقلها مرة أخرى إلى الملف الرقمي في 
مكانها من الملف الأصلي. 


مدى استخدام المعارف اللغوية في عملية التعرف الآلي على الحروف (من خلال 
مراعاة خصائص الحروف من حيث الشكل والترتيب والضبط بالشكل) 
فللحروف العربية خصائص من حيث الشكل والموضع من الكلمة» فهناك حروف 
تأي في أول الكلمة فقط» وهناك حروف تأي في أوسطها ومنتصفها فقط » وهناك 
حروف متطرفة تأتي في أواخر الكلمة فقط (الحروف الاستهلالية - الحروف المتوسطة- 
الحروف المتطرفة)» بل يتغير رسم الحرف باختلاف ترتيبه مع الحروف الأخرى بداية 
أو توسطا أو نهاية. 
ومثال ذلك: 
الألف والهمزة 
تختلف أشكال كتابة الألف والهمزة - على سبيل الحصر - على النحو التالي: 
(1-1-ا-ء-1- و ئ-ى) 
فجميع هذه الصور تأت في بداية الكلمة ماعدا 
ووی دی 
وجميعها أيضا تأي في وسط الكلمة ماعدا 
ی 
وجميعها كلها تأ في نهاية الكلمة ماعدا 
ل 


ت 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


وقد تجتمع أكثر من همزة في بداية الكلمة ولكن على النحو الآتي فقط : 


ومن ذلك أيضا مراعاة قواعد الرسم الإملائي في العربية» ومنها: 

توالي الأمثال في العربية “: 

هرب العربية من توالي الأمثال إذا توالى حرفان أحياناء وتهرب منه بشكل قاطع إذا 
توالت ثلاثة أحرف. 

ويمكن حصر الحروف التي لا تتوالى مرتين » ومن ثم تخطئتها إذا جاءت مكررة» 
أما توالي “ا حروف فممنوع في العربية منعا قاطعا مثل( للد ) في (للليمون) وصوابها 
(لليمون)» ومن ثم يمكن حذف ا حرف ال مكرر الثالث تلقائيًا أو استبداله بها يشبهه. 

ومن ذلك أيضا - عند التعرف على النصوص المضبوطة بالشكل- مراعاة قواعد 
الضبط والتشكيل: 

أ- الفتحة والكسرة والضمة والسكون, تأتي في جميع مواضع الحروف من الكلمة ( 
الحرف الأول والثاني والثالث» .. 

ب- التنوين بالفتحة والكسرة والضمة يأتي في نهايات الكلمة فقط (على الحرف 
الأخير) ولا يآتي التنوين في بداية الكلمة (على الحرف الأول) أو في وسطها (وقد يأتي 
التنوين قبل الآخر في حال التنوين بالفتحة فقط في إحدى صور كتابة التنوين بالفتحة). 

ج- التنوين بالفتحة يزيد حرفا هو الألف على الكلمة غير المنتهية بتاء مربوطة أو ياء. 

د- السكون لا يأتي في الحرف الأول من الكلمة العربية والقاعدة اللغوية في ذلك 
مشهورة: ل دا ساك 

ف - لآ يعوا ساكتان ف العريية ( )۹ 

و- الشدة لا تأتي في الحرف الأول من الكلمة العربية؛ ذلك أن الشدة مكوّنة من 
حرفين: حرف ساكن+ حرف متحرك. 


ز- آلف الوصل لا تضبط بالشكل. 


١‏ - راجع: بحوث ومقالات في اللغة » د. رمضان عبد التواب» مكتبة الخانجي بالقاهرة» ط ۰۳۰ 5108 ١ه‏ -19190م2, 
ص ۲۷. 
۲ - راجع: النحو الوافي. د. عباس حسن. دار المعارف. ط ”. مصرء القاهرة» ج؟. ص11 4 - ج ۳٣.ص‏ ` 2 


ا 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


المعيار الثامن: 

وجود تقنية لغوية متقدمة تمكنها من التصحيح التلقائي لأخطاء القراءة بالاعتماد 
على مدقق إملائي يعتمد على محلل صرفي أو من خلال معجم لغوي مزود بالتطبيق 
تكون بمثابة المرجع في التصحيح التلقائي. 


المعيار التاسع : 

مدى الاستفادة من تصحيحات المستخدم وتدريب برامج التعرف الآلي على 
التعلم من أخطائه السابقة» ومن ثم تكوين معجم مفردات خاص بالمستخدم» يضمن 
التصحيح وفقا للحقل اللغوي الذي عادة ما يكتب المستخدم فيه» أو وفقًا لمفردات 
المستخدم التي يستخدمها بكثرة على هذا التطبيق. 


%۰ 


€۷ 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


-/غ- 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقيا أو تداولها تجاريا - 


الفصل الثاني 
المبحث الأول 
تطوير تقنيات التدقيق الإملائي والنحوي لتفعيل دورها في تعليم العربية 


4 


تمهيد: 

يدف هذا المبحث إلى إبراز دور تقئيات اللغة العربية الحاسوبية في التعليم 
الإلكتروني» من خلال اتخاذ المدققات الإملائية والنحوية نموذجًا ومثالاً؛ إذ إن من 
الممكن استخدام هذه التقنيات الإلكترونية في تعليم اللغة العربية لمستخدميها بطريقة 
غير مباشرة» فعادة ما يعتمد المستخدم العربي على هذه التطبيقات (المدققات الإملائية 
والنحوية) في الوصول إلى عربية صحيحة لنصوصه في برامج معالجة النصوص العربية» 
وينتهي دور التقنية بعد تحقيق هدفها التطبيقي» لكن المبحث الذي بين أيدينا يدف إلى 
أن يمتد عَمَلُ هذه التقنيات اللغوية إلى الإسهام في تعليم مستخدميها قواعد العربية 
كذلك» إضافة إلى القيام بدورها الأسامي في التدقيق الإملائي والنحوي. 

يتناول المبحث التعريف بتطبيقات التدقيق الإملائى والنحوي 0015] 2501001128 
وأشهن المدققات الإملاية والفحوية ثم يعرضن للوطيقة الأساسية هذه التطبيقات 
وكيفية استخدام هذه التقنيات اللغوية في تعليم العربية للمستخدمين العرب بطريقة 
إلكترونية» من خلال عدد من الأخطاء الإملائية والنحوية الشائعة التى تعالجها تلك 
التطبيقات» مثل: الخلط بين أشكال همزتي القطع والوصل في أول الكلمةء والمخلط 
بين التاء المربوطة (ة) والحاء (ه) في نباية الكلمة العربية» والخلط بين أشكال الياء 


تت 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


في نهاية الكلمة العربية» والخلط بين علامات الإعراب بالحروف (المثنى - جع المذكر 
السالم - الفعل المضارع - الأفعال الخمسة - الفعل الأمر) » وعدم المطابقة بين عنصري 
الإسناد. ... وغير ذلك من الأخطاء الإملائية والنحوية. 

أما الآليّة الجديدة المقترحة في هذ المبحث فنعرض من خلاها للإضافات التعليمية 
التي تسهم في تطوير تعلم العربية إلكترونياء مثل: توصيف الخطأ وتحليله» والباب 
النحوي للمسألة وعلاقتها بشجرة العلاقات النحوية» والاستماع إلى الشاهد التراثي 
في المسألة وعرضه مع تلوين الكلمة محل الشاهد» وتوثيق القاعدة من مراجع العربية» 
والربط بين الأخطاء الشائعة عند المستخدم أو عند المستخدمين العرب جميعاء والتنبيه 
عند تكرار نوع الخطأ من المستخدم بشكل خاص أو عام (خطأ شائع). 


کت 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


يقترح المبحث فكرة آلية لغوية هدفها تقريب العربية من أهلهاء واستخدام التقنيات 
الحديثة في تعلم العربية وقواعدهاء وهي لا تتعامل مع المتعلم بطريقة الدروس التقليدية 
درسًا درسّاء وإنها من خلال التطبيق العمل على النصوصء ومن خلال معالجة أخطاء 
المستخدم نفسه» وتحليل هذه الأخطاء وردّها إلى قضاياها الأساسية وأصوها الكلية في 
العربية نحوًا وصرفا. 

والآلية المقترحة أداةٌ لغوية مدمجة (81118111) تعتمد على خرجات برامج التدقيق 
اللغوي» وعلى قاعدة بيانات تحليلية تقارن الآلية من خلاها الحالة التى عليها الكلمة 
أو مله باشالة gE‏ ايوق اللخرع وهو تكو لبون قدي 
التأصيل العلمى للقضية محل الإشكال إملاتبًا أو نحويًا أو تركيبيًا. ولا تكاد الدراسة 
تتعرض لوجهة النظر الحاسوبية التقنية» وإنما تعرض للجانب اللغوي فقط؛ لتخصص 
الباحث فيه» تاركة الجانب التقني البربجي إلى بحث آخر. 

أما معوقات هذه الآلية فتتلخص في ضعف بعض خر جات برامج التدقيق الإملائي 
والنحوي وعدم استقصائها كثيرًا من المشكلات اللغوية» كمشكلات اللبس اللغوي 
بنية وتركيبّا لكنها في الوقت نفسه تصلح لأن تكون أساسًا يبنى في تعليم العربية 
بطريقة إلكترونية جذابة» مع دعوة الباحثين إلى تركيز جهودهم لحل مشكلات برامج 


کک 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


التدقيق الإملائي والنحوي» ومن أهمها مشكلة اللبس في البنية والتركيب» فكثير 
من مستخدمى تطبيقات التدقيق الإملائى -على سبيل المثال- يضيقون ذرعا ذه 
التطبيقات» وذلك بسبب فشلها في اكتشاف الكثير من الأخطاء الإملائية في سياقات 
معينة» فالكلمة «اضرب» في سياق جملة زمنها المضارع (دعوني اضرب لكم مثلا)؛ 
تعد خطأ إملائيًا يلزم تصويبه إلى الكلمة «أضرب» E‏ 
سباق الازكيب ال النبران عد عه إمادياه لكو امدق يفشل فق ارف عل مكل 
هذه الأخطاء» ومن ثم في اقتراح تصويبهاء ويرجع السبب في ذلك إلى اللبس الصرفي» 
فالمدقق الإملائي يتعامل مع الكلمة المفردة بلا نظر إلى سياقهاء فهو يتعامل مع الكلمة 
في مستواها الصرفي فقطء ومن ثم فإن أية احتمالات صرفية سليمة أو صحيحة تحمل 
المدقق على عدم تخطئة الكلمة» على الرغم من كونها خطأ سياقَيًا» ففي الجملة: (شعب 
من فصيلة الصبار» لا يمكن للمدقق أن يكتشف الخطأ في كلمة «(شعب» ومن ثم لا 
يقترح الصواب»عشب»» وذلك لأن كلمة اشعب» صحيحة صرفيًا ولكنها خطأ في 
هذا السياق» وليس من شأن المدققات الإملائية الحالية أن تنظر إلى السياق» بل إنها 
تكتفي بالتحليل الصرف للكلمة. ومثل ذلك التراكيب» ومنها: «بنات نادر»» وصوابها 
انبات نادر) » و)تعقدت الجرحى) » وصواءها «تفقدت الجر حى)» فهذه الأخطاء جميعها 
تحتمل وجهًا من الصواب منفردة(دون سياق)» ولكنها في سياقاتها تحتاج إلى التصحيح» 
ومن هنا يتضح بجلاء مدى انعكاس ظاهرة اللبس الصرفي على عمل المدقق الإملائي. 


١‏ - راجع: مشكلات التحليل النصي للمحتوى العربي على شبكة الإنترنت» د. سلوى حادة» عمرو جمعة» كتاب مؤتمر 
هندسة اللغة الثامن» »7١ ٠/8‏ جامعة عين شمس» كلية الهندسة. 


د = 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


الدراسات السابقة 

المدققان الإملائي والنحوي آليتان برمجيتان تتعاملان مع النصوص العربية ( في 
الكلمة والتركيب معًا)» وتتلخص وظيفتاهما في مراجعة صحة الكلمة إملاءً وإعرايًا 
وصحة الجملة تركيبًاء ومن ثم اقتراح بدائل صحيحة للكلمة غير الصحيحة إملاءًَ أو 
نحوّاء أو اقتراح تعديل للجملة غير الصحيحة تركيبًا؛ لأجل الوصول إلى الصواب 
النحوي أو التركيبي. فالمدقق الإملاثي في برا مج مايكروسوفت لا تقدم تعليلاً تعليميًا 
للصواب المقترح من قبلهاء وإن| تكتفي باة قتراح البدائل» أما المدقق النحوي الخاص 
بتطبيقات مايكروسوفت فيضيف إلى اكتشاف الخطأ وتصحيحه بعدًا تعليليًا تعليميًا 
وهو الإشارة إلى نص القاعدة التى بنى المدقق عليها اكنشافه الخطاً والشيه إليه» لكن 
هذه الإشارة التعليمية لا تعدو أن تكون جملة واحدة - مثل: «لابد أن يتفق النعت 
والمنعوت في العدد والنوع» - وهذه الجملة تناسب الغرض التطبيقي لا التعليمي من 
البرنامج. أما الآلية التعليمية المقترحة فتضيف إلى الهدف التطبيقي اللغوي بعدًا تعليميًا 
آخرء على غرار البعد التطبيقي» يشمل مع كل اقتراح للتصويب: البحث على الإنترنت» 
وتحليل الخطأء والقاعدة» والمرجع المعتمد في ذلك (مع رابطه على الإنترنت)» والشاهد 
الفصيح (مع إمكان الاستاع إليه)» وتحديد نوع الخطا إن كان من الأخطاء الشائعة 
مثلاء بالإضافة إلى تحديد مدى تكرار الخطأ لدى المستخدم. 


التعريف بتطبيقات التدقيق الإملائى والنحوي :proofing tools‏ 

إن من أشهر المدققات الإملائية مدقق برنامج مايكروسوفت وورد» الذي طرح 
لأول مرة مع «وورد» في الإصدار 5,٠‏ منه عام ١۱۹۹ء‏ ولم يكن من إنتاج شركة 
مايكروسوفت ذاتهاء بل اشترته من شركة كولتكء التي يقع مقرها الرئيس في القاهرة» 
وهي أيضاً الشركة التي طورت المدقق النحوي لمايكروسوفت ووردء الذي طرح أول 
انلك 


مرة مع الإصدار عام ۰ ١م‏ 
وهو سهل الاستخدام» ويطرح بدائل عديدة لتصحيح الكلمة لغير المتخصصين» 


١‏ - راجع: موقع شركة كولتك - الشرق الأوسط لتقنيات معالجة اللغات الطبيعية على الإنترنت» الرابط التالي: 
http: //www.coltec.net /default.aspx?tabid=2 24‏ 


ا 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


ويميز بين الخطأ الإملائي والخطاً اوري عن طريق لون المخط المتموج الموجود 
تحت الكلمة الخطأ؛ فاللون الأحمر يعني خطأ إملائيّاء واللون الأخضر يعني خطاأ 
ا . وإذا ما نقر المستخدم بزر الفأرة الأيمن على الخط المتموج» فستظهر 
Ss Cl‏ 
الإملائي أما في حالة الخطأ النحوي فتظهر النافذة شرحًا مبسطًا للخطأ النحوي مع 
الكلمة المقترحة لتصحيحه. ففى جملة «لا تكن من المهملون» - على سبيل المثال - 
البرنامج رسالة مضمونها: «الاسم مجرور بحرف الجر» تُستبدّل كلمة «المهملين» بكلمة 
«المهملون» لتصحيح الخطأ). 

ومن أشهر المدققات كذلك مدقق شركة صخر» واسمه «المصحح الآلي» ومن 
الممكن دمه في برنامج مايكروسوفت وورد» أو استخدامه مع بعض البرامج الأخرى» 
ويكتشف المصحح الآلي الأخطاء التي تقع عند الكتابة بالعربية» ويقترح مجوعة من 
البدائل الصحيحة, ثم يبدأ في محاولة اكتشاف الأخطاء النحوية. 

ويتميز المصحح عند تصحيحه النصوص العربية عن غيره من برامج ج التصحيح 
بعدد من المميزات وهى: التصحيح التلقائى» وتقليل عدد الاقتراحات» ومراعاة 
السياق» والتعامل مع المصطلحات. والتعامل مع التشكيل!' 

ويتعامل المدقق الإملائي والنحوي -حسب تسميتههم|- مع نوعين من الأخطاء في 
النصوص العربية» فالمدقق الإملائي كا يبدو من اسمه يتعامل مع الأخطاء الإملائية» 
والمدقق النحوي يتعامل مع الأخطاء النحوية. 
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استخدام التقنيات اللغوية في تعليم العربية إلكترونيًا: 

الآلية المقترحة تضيف إلى التصحيح الآلي بُعدًا تعليميًا تطبيقيًاء إذ لا يكفي المستخدم 
حينئذ بتصحيح الخطأ فحسب» بل يستطيع من خلاهها أن يتعلم قاعدة جديدة من قواعد 
العربية» ون يدعم التصحيح المقترح بتحليل الخطأ الموجود وأساس تصويبه» والبحث 


: راجع: موقع شركة صخر لبرامج الحاسبء الرابط‎ - ١ 
.http: / /www.sakhr.com /arabicresources.aspx 


کک کڪ 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


عن الكلمة واستخداماتها على الإنترنت» كما يمكنه أن يطلع على توثيق ذلك من المراجع 
اللغوية العربية» ومن ثم معرفة الباب النحوي الذي تنتمي إليه ير 
ار اضر عر ري ا ا زر د اير اما 
التراث العربي في القرآن الكريم وأقوال العرب وأشعارهم» وأن يستمع إليها كذلك 
بصوت المشاهير. ذلك كله من خلال روابط متصلة بصفحة على الإنترنت» أو قاعدة 
بيانات لغوية. 

ويمكن للآلية الربط بين الأخطاء الواحدة والمتشاءبة» والتعرف على تكرار هذا 
الخطأ عند المستخدم الواحد» وتحديد نوع الخطأ إن كان من الأخطاء الشائعة عند 
المستخدمين العرب. كا يمكن للآلية أن تنبّه المستخدم أثناء الكتابة لتجنب الوقوع في 
الخطأ نفسه في حال تكرّر نوعه» من خلال ذاكرة أخطاء المستخدم الخاصة أو ذاكرة 


الأخطاء الشائعة العامة. 
والجدول الآني يلخص المعلومات الجديدة التي تضيفها الآلية بوصفها وسيلة 
تعليمية إلكترونية. 
إضافات آلية التعليم الإلكترون 
الخطاً توصيف الخطأ وتحليله 
البحث البحث في جوجل 
المزيد من المعلومات الباب النحوي للمسألة وعلاقتها بشجرة العلاقات النحوية 
الاستماع إلى الشاهد التراثي في المسألة وعرضه مع تلوين الكلمة محل 
سح الشاهد 
التوثيق توثيق القاعدة من المراجع العربية 
التكرا الربط بين الأخطاء الشائعة من المستخدم بخاصة أو من المستخدمين 
1 العرب بعامة 
التنبيه عند تكرار نوع الخطأ من المستخدم بشكل خاص أو عام (خطأ 
التنية بيه عند تكرار نوع 00 م بشكل خاص أو عام ( 
اع ل 


جدول رقم )١9(‏ لإضافات آلية التعليم الإلكتروني 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


وسنعرض فيا ياي عددًا من الأخطاء الإملائية والنحوية الشائعة» ونشرح كيفية 
الإفادة من تصحيح هذه الأخطاء في تعليم العربية للمستخدمين العرب بطريقة إلكترونية. 


أولا المدقق الإملائى: 
من الأخطاء الإملائية الشائعة في النصوص العربية(١):‏ 


- الخلط بين أشكال همزتي القطع والوصل في أول الكلمة'": 

فرسم الهمزة في الكلمة «إنتقد» - على سبيل المثال - خطأ إملائي» يكتشفه المدقق 
الإملائي تلقائيًا وينبه إليه» ويقترح بدائله» ثم يأتي عمل آلية التعليم الإلكتروني بعد ذلك 
في عرض توصيف الخطأ وتحليله» وإمكان البحث عن الكلمة في جوجلء وربط المسألة 
بالباب النحوي هاء وبيان علاقتها بشجرة العللاقات النحوية» والاستماع إلى الشاهد 
التراثي في المسألة وعرضه» مع تلوين الكلمة محل الشاهد» وتوثيق القاعدة من المراجع 
العربية» والربط بين الأخطاء الشائعة عند المستخدم نفسه أو المستخدمين العرب جميعاء 
ثم التنبيه عند تكرار نوع الخطأ من المستخدم بشكل خاص أو عام (خطأ شائع). 


إنتقد م اجا المط الاسم للملايات المتحده الآمريكية وشكك فى نوايها 
اقتراح التصويب: انتقد 
البحث على الإتترنت: انتقد 

حبال) تحليل الحطا: الهعزة في كلمة "إتتقد" همزة قطع رإ) لبه دعوة لإعضاء المجلس ا اجتماعا 
والصواب أن تكون همزة وصل (ا)؛ لان كلمة : 
"إنتقد" فعل ماض خماسي. 


ي القاعدة: الهمزة في أول ماضي وأمر ومصدر الفعل كز a‏ أفراد 
لوزيرة ااا هة وضل. ون مع ناشطين سوريون و ن 


۴ راجع لمزيد من التغصيل: همزة الوصل والقطع/ 
1 کاب الإملاء والترقيم لعبد العليم إبراهيم 
المعار [مصدر /ر ابط] 


الشاهد الفصيح: "فإن اتتهوا فإِنْ اللة عَفورَ رَحِيمٌ* 
[سماع] 


خطا شائع: الخلط بين همزتي الوصل والقطع 
تكرار الخطأ لدى المستخدم: إنتقل , إتتعل. 


ت 


شكل رقم (7١)لمعالجة‏ المدقق الإملائي كلمة ”إنتقد“ بهدف تعليمي. 


١‏ - راجع: أحكام الإملاء في اللغة العربية وقواعده في: 

الهمزة في اللغة العربية» مصطفى التوني» دراسة لغوية» القاهرة ٠۹۹۰‏ م. 

دراسة في قواعد الإملاء؛ عبد الجواد الطيب.دار الأوزاعي» ط. ثانية» بيروت 505 ١ه/‏ 1985م. 
قواعد الإملاء» عبد السلام هارونء دار إيلاف الدولية» الكويت» ط. أولى» 474 ١ه/‏ 5١٠٠م‏ 


۲ - راجع: الإملاء والترقيم في الكتابة العربية» عبد العليم إبراهیم» ص ۳۹-۳۷. 
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- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


- الخلط بين التاء المربوطة (ة) والهاء (ه) في نهاية الكلمة العربية: 

فكتابة كلمة «المتحده» بالهاء لا بالتاء - على سبيل المثال - خطأ إملائي شائع» يكتشفه 
المدقق الإملائي تلقائيًا وينبه إليه ويقترح بدائله» ثم يأتي عمل آلية التعليم الإلكتروني 
كما يوضح الشكل الآتي: 


إنتقد المجلس الوطني السورى الولايات المتحده الأو كو 


ليخت على الإتترنت: الضحدة 
حال سوريا . وذلك اثر عدم توجه دعوة لإعت تا الا الهاء (ه) في كلمة “التحد" ليست 
5 5 2 3 5< علاعة تآتيث. وضوابها أن يستيدل بالهاء (ه) تا» 
هريوطة (ة). 


1 1 , 7 لقاعدة: الناء ١‏ رطة (ة) من علاهات التالييث 
لوزيرة الخارجية الأمريكى هيلاري كليئتون مع صوصف و 


اجع العزية عن التفصيل- علاعات تاتيث الاسم[ 
كلاب النخو الأساسي ل محمد حماسة,مخثار عفر 
المعارضه [عصدرارابط] 
اشاهد القصح: "نچا عَلَبْهِمْ عَؤْصَنَة" [سماع 


ج: الخلط بين تاء التأنيث المربوطة وخرف 
لهاء 


شكل رقم (17) لمعالجة المدقق الإملائي كلمة ”المتحده“ بهدف تعليمي. 


- الخلط بين أشكال الياء فى نباية الكلمة العربية: 

فالياء في نباية الكلمة العربية إما أن تكون ألفا مقصورة (ى) أو ياء منقوصة (ي)» 
فكلمة «منطقى» بمنقوطتين في الكتابة الشامية يمكن أن تكتب خطأ هكذا: «منطقى» 
بياء غير منقوطة. 

- الخطأ في رسم ال همزات المتوسطة والمتطرفة (ء» ئ» ؤ» أ آ) في الكلمة العربية: 

فكلمة «شىء» بهمزة على السطر يمكن أن تكتب E‏ «شيئ» مهمزة على 
نرة. 

- الخطا في وصل كلمتين دون الفصل بينه| بمسافة: 

فالكلمتان «يا الله» يمكن أن تكتبا خطأ هكذا «ياالله» دون مسافة بينه|. 

- وجود نقص في حروف الكلمة العربية: 

فكلمة «المحامي» يمكن أن تكتب خطأ هكذا: «المحام». 


. ٥۷-٥١ راجع: الإملاء والترقيم في الكتابة العربية» عبد العليم إبراهيم» ص‎ - ١ 


-لاهم- 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


- وجود تكرار أو زيادة في الكلمة ما تمجّها العربية: 

فكلمة «مشكور» تكتب عادة - لاسيم| في وسائل الإعلام الاجتماعي- خطأ هكذا: 
«مشكووووور» للدلالة على المبالغة في الأمر. 

- وجود قلب مكاني بين حروف الكلمة العربية لعوامل لهجية: 

فكلمة «يحفر» يمكن أن تكتب خطأ هكذا: «(يفحر». 

- استبدال بعض الحروف بحروف الكلمة لعوامل هجية: 

ومثاله إبدال البعض حرف الجيم «ياء» في كلمة «رجال»». فيكتبونها «ريال» تأثرا 
الج 

- الخلط بين الحروف المتجاورة في لوحة مفاتيح الحاسوب: 

ابن خط ي ا قن ا ن ا ع الكداية عل لر اا 
فكلمة «فاروق» على سبيل المثال تكتب خخطأ هكذا: «فاروف» لتجاور حرفي «الفاء» 
و»القاف» في لوحة المفاتيح» ومن أمثلته أيضًا الحروف التي تكتب بطريقة مركبة على 
لوحة المفاتيح باستخدام مفتاح انط“ فكلمة ”إيمان“ يمكن أن تكتب خطأ هكذا: 
”غيمان“ فا همزة المكسورة تكتب حاسوبيًا بالضغط على ”غاگاطء+“» وفي حال عدم 
الفط عل ااا كس عا فل القوو: 

هذه بعض الأخطاء الإملائية الشائعة» التي يقع المستخدم العربي فيها أثناء 
استخدامه برامجَ النصوص» وتستطيع برامج التدقيق الإملائي التعرف على هذه 
الأخطاء وتصحيحهاء > لکن بلا تعليم للمستخدم وتدريب له على القاعدة التي تحكم 
بالصواب أو بالخطأ في المسألة. ركو سه مرياه e‏ 
التدقيق الإملائي آلية تضم بعض القواعد اللغوية المبسطة التي تشرح الخطأ وتعرض 
أساس تصحيحه؛ تجنبًا لوقوع المستخدم في الخطأ مرة أخرى» ومن ثم تطوير طرق 
تعليم اللغة العربية إلكترونيا من خلال التقنيات اللغوية. 


-مه- 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


ثانيا المدقق النحوي: 

:Arabic Grammar Checker التعريف بالمدقق النحوي‎ 

هو آلية برمجية تتعامل مع النصوص العربية ( الكلمة والتركيب معًا)» وتتلخص 
وظيفة المدقق النحوي في مراجعة صحة الكلمة إعرابًا وصحة الجملة تركيبًاء ثم اقتراح 
بدائل صحيحة للكلمة غير الصحيحة نحوّاء أو اقتراح تعديل للجملة غير الصحيحة 
تركيبًا؛ لأجل الوصول إلى الصواب النحوي أو التركيبي. 

كيفية عمل المدقق النحوي: 

إن البحث لا يقدم مدقّقًا نحويًاء وإنا يقدم برمجة يمكن إضافتها إلى المدقق 
النحوي ليكون أداة تعليمية يمكن من خلاها تعلم قواعد العربية بطريقة إلكترونية 
تطبيقية عملية» ومن ثم فالآلية الجديدة تعتمد على المدقق النحوي في اكتشاف الخطأ 
النلحوي» وهو الذي يعتمد في كثير من عمله على المدقق الإملائي وأداتيه؛ أداة التحقق 
.Verifcation Tool‏ وأداة المقترحات 001 5587 كما يعتمد كذلك على 
بعض الآليات اللغوية الأخرى المضمنة في المدقق النحوي ومنها - على سبيل المثال - 
Part Of Speech Tagger‏ » حيث يتعرف من خلال هذه الأداة على نوع الكلمة من 
حيث كونها اسن أو فعلًا أو حرقاء ثم يحدّد سماتها التركيبية والدلالية» ويدقق الجمل 
من حيث النحو والتركيب. 

والجدير بالذكر هنا أن المدقق النحوي الخاص بتطبيقات مايكروسوفت يضيف إلى 
اكتشاق الخطأ وتصحيحه بعدا تعليليًا تعلبساء وهو الأشارة إل ت القاعدة الى بن 
اللدقق غليها ا تضاف اطا رال إل لك هذه الإشارة التعليمية لأ تعدو أن تكن 
جملة واحدة» مثل: ”لابد أن يتفق النعت والمنعوت في العدد والنوع“» وهذه الجملة 
تناسب الغرض التطبيقي لا التعليمي من البرنامج. 

أما الآلية التعليمية المقترحة فتضيف إلى الهدف التطبيقي اللغوي بُعدًا تعليميًا آخر» 
على غرار البعد التطبيقي» يشمل مع كل اقتراح للتصويب: البحتٌ على الإنترنت» 
زغل الخطأء والقاعدة» والمرجع المعتمد في ذلك (مع رابطه على الإنترنت)» والشاهد 


١‏ - راجع: موقع شركة كولتك - الشرق الأوسط لتقنيات معالجة اللغات الطبيعية على الإنترنت 
.WWW.coltec.com‏ 


4م 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


الفصيح (مع إمكان الاستماع إليه)» وتحديد نوع الخطأ إم كان من الأخطاء الشائعة» 
إضافة إلى تحديد مدى تكرار الخطأ لدى المستخدم. 

وسنعرض فيا يأتي أمثلة لبعض الأخطاء النحوية الشائعة في النصوص العربية: 

- الخلط بين علامات الإعراب بالحروف (المثنى - جمع المذكر السالم‎ -١ 
الفعل المضارع -الأفعال الخمسة- الفعل الأمر)‎ 

عدم المطابقة بين عنصري الإسناد. 

الخطأ في كتابة العدد بالحروف في اللغة العربيةء وذلك على التفصيل الآتي: 

الخلط بين علامات الإعراب بالحروف «المثنى - جع المذكر السالم - الفعل 
المضارع- الأفعال الخمسة - الفعل الأمر). 

الخطأ في علامة الإعراب من الأخطاء الشائعة لدى المستخدم العربي» لكن هذا الخطأ 
لا يظهر إلا في حالة الإعراب بالحروفء فالعربية المعاصرة المكتوبة تتجاهل حركات 
الإعراب من الفتحة والضمة والكسرة إضافة إلى عدم الحركة أو السكون» ومن ثم فالخطأ 
في أي من حركات الإعراب لن يظهر؛ لعدم ظهور علامات الإعراب على الكلمات في 
العربية المعاصرة المكتوبة» وذلك على العكس من علامات الإعراب بالحروف (الألف 
رالات والباء والواوة وحذف عرف الع وتوت النون: ,)© ال تير جا لكورن 
هات اراب يها جر ةلا سرامن الت فى رافق ا ساق الكلمة 

وتنبني فكرة عمل المدقق النحوي في بعض أجزائها على السات النحوية والتركيبية 
لسوابق الكلمة الواحدة ولواحقها؛ فالكلمة صرفيا تتكون من ساق 5)6۳ وزوائد 
×۸ (هي السوابق واللواحق)» والكلمة الصحيحة إملاءً هي الكلمة الصحيحة من 
حيرت سللامة ساقها ومن حيث قزل هذه الساق لتلك السوابق واللر احق انخاصة اء 
ثم إن هذه السوابق واللواحق سماتٍ نحوية وتركيبية تمكن المدقق النحوي من اكتشاف 
الأخطاء النحوية . 

وأوضح الأمثلة على ذلك (من سوابق الأسماء) حروف الجر المتصلة بالكلمة؛ الكاف 
(ك) » والباء (ب) » واللام (ل). فهذه الحروف تجر الأساء التي تدخل عليهاء وتختلف 


١‏ - راجع: النحو الأساسى, د. أحمد ختار» د. مصطفى النحاس» د. محمد حماسة» دار السلاسل» الكويت» ٤۱۹۹ء‏ ط 
ص77 55. 


هھ 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


علامات الجر باختلاف هذه الأسماء؛ ما بين الكسرة في حال المفرد» وما يجمع بالألف 
والتاء» والفتحة في حال الممنوع من الصرف» والياء في حالتي المثنى وجمع المذكر السال. 
لکن أثرها يتجلى - كا سبق أن ذكرنا - في المستوى الكتابي للعربية المعاصرة في المثتى 
وجمع المذكر السالم منها دون غيرهما لكون الإعراب فيه) بالحروف دون الحركات التي 
تتجاهلها العربية المعاصرة المكتوبة حيث تكتب العربية المعاصرة دون علامات الضبط. 

فعند معالجة المدقق النحوي لكلمة «بالوالدان» - على سبيل المثال - سيقوم المحلل 
الصرفي المضمن في المدقق الإملائي بتحليلها على النحو التالي: 

«بال» (سابقة) = «ب) | + «أل» (التعريفية) 

وال ر 

”ان“ (لاحقة) = علامة رفع المثنى 

لكن السابقة («بال» = حرف جر + أل التعريفية) لا تتوافق نحويًا مع اللاحقة 
(«ان» = علامة رفع المثنى)» إذ كيف يجتمع حرف الجر مع علامة الرفع في كلمة 
واحدة» ومن ثم يبدأ النظام في تخطئة الكلمة» واقتراح احتمالات الصواب لماء وعلى 
رأسها تصويب إعراب الكلمة إلى «بالوالدين» بدلا من «بالوالدان». 


بالوالدان 


Spelling and Grammar: Arabic (Egypt) 


Not in Dictionary: 


بالوالدان 


Suggestions: 


Dictionary language: | Arabic (Egypt) 


[EF] Check grammar 


Options... 


شكل رقم (5١)لمعالجة‏ المدقق النحوي كلمة ”بالوالدان“. 


ولا يعتمد المدقق النحوي - في اكتشافه الأخطاءَ - على السمات النحوية والتركيبية 
للسوابق واللواحق» وإنما يطبق الأمر ذاته على الأدوات وحروف المعاني» فحروف 


ا 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


الجر المنفصلة (منء إلى» في» عن» على) يشل حروف الجر المتصلة (ل» ب» ك) تتوافق 
- على سبيل المثال - مع بعض اللواحق المتصلة بالاسم المجرورء ففي التركيب ”إلى 
الحديقتان“» لا يمكن أن تجتمع اللاحقة ”ان“ في كلمة ”الحديقتان“ التي تدل على 
الرفع مع حرف الجر ”إلى“ صاحب تأثير الجر في الأسماء الواقعة بعده» ومن ثم يستشكل 
امدقق النحوي الكلمة ويخطتهاء ويقترح تصويبها ”الحديقتين». 

ومنه أيضا التركيب ”لن يذهبون”» حيث يستحيل أن تجتمع اللاحقة ”ون“ في 
كلمة ”يذهبون“ والأداة ”لن“ التي تنصب الفعل المضارع» فعلامة نصبه هنا حذف 
النون» ومن ثم يستشكل المدقق النحوي الكلمة» ويقترح تصويبها ”يذهبوا . 

وخلاصة القول: إن للزوائد من السوابق واللواحق وظيفتين؛ تصريفية وتركيبية» 
وتحاول تطبيقات التدقيق الإملائي والنحوي توظيف هاتين الوظيفتين التصريفية 
والتركيبية في عملية التدقيق الآلي. 

هنا انتهى البعد التطبيقي للمدقق النحويء إذ اقتصر عمله على اكتشاف الخطأ والتنبيه 
إليه» ويأتي بعد ذلك دور الآلية التعليمية في التعليل والتوضيح لكل اقتراح تصويبي من 
قبل المدقق النحويء ففي المثال: ”بالوالدان“ تتعامل الآلية على النحو التالي: 


بالوالدان اقتراح التصويب: بالوالدين 


لبحث على الإتترنت: بالوالدين 


تحليل الخطأ: الباء حرف جر - الوالدان مثنى 
مجرور وعلامة جره الياء وليس الألف. 


القاعدة: يرفع المثتى بالألف وينصب ويجر بالياء. 


راجع لمزيد من التفصيل: إعراب المثتى/ كتاب 
النحو الوافي ل عباس حسن [مصدر/رابط] 


الشاهد الفصبح: "وَيِالْوَالِدَيْنِ إِخْسانًا" [سماع] 
خطأ شائع: الخلط بين علامات إعراب المثتى. 


تكرار الخطأ لدى المستخدم: المسلمانء الدوليان. 


شكل رقم )٠١(‏ لمعال جة المدقق النحوي كلمة ”بالوالدان“ بهدف تعليمي. 


ل 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


؟- عدم المطابقة بين عنصري الإسناد أو التركيب: 

بالإضافة إلى اعتماد المدقق النحوي على السوابق واللواحق في اكتشاف الأخطاء 
الإعرابية فهو يعتمد عليها كذلك في اكتشاف وتصحيح العديد من الأخطاء التركيبية» 
مثل المطابقة في العدد. والتعريف والتنكير» والنوع» والإعراب بين كل من المسند 
والمسند إليه (الفعل والفاعل أو الفعل ونائب الفاعل- المبتداً والخبر)» والصفة 
وال موصوفء والضمير ومرجعه» والبدل والمبدل منه» والجال وصاحب الحال» واسم 
الإشارة والمشار إليه. 

- ففي هذه الجملة: ”الجنود يدافعان عن الوطن“ خطأ نحوي يتلخص في عدم 
التطابق بين المسند والمسند إليه في العدد. 


الجنود يدافعان عن الوطن 
Spelling and Grammar: Arabic (Saudi Arabia)‏ 


6ن الجنود يدافعان عن الوطن 


Dictionary language: | Arabic (Saudî Arabia) 


[¥] check grammar 


Options... 


شكل رقم (17)لمعالجة المدقق النحوي كلمة ”يدافعان“. 


فالمسند إليه ”الجنود“ في الجملة السابقة جمع تكسيرء والمسند ”يدافعان“ مسند إلى 
ألف الاثنين» وهو خطأ بين في العربية» صوابه أن يتفق ضمير الفاعل مع العائد عليه في 
العدد والنوع'"". 

والمدقق هنا - ك| سبق أن أوضحنا - يعرض للقاعدة التي تحكم بتصويبه الخطأ النحوي» 
غير أنه لا يضيف أي بعد تعليمي للمسألة» وهو ما يمكن معالجحته على النحو الآتي: 


. ٤۳۳-٤۳۲ راجع: النحو الأساسي» د. أحمد ختار» د. مصطفى النحاس» د. محمد حماسة» ص‎ - ١ 


ا 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


الجنود يدافعان 

اقتراح التصويب: يحافعون 

البحث على الإتترنت: يدافعون 

تحليل الخطا: المسئد إليه "الجنود" جمع تكسير. 
والمستد "يداقعان" مسئد إلى آلف الاثنين. وصوابه 
أن يتفق ضمير الفاعل مع العائد عليه في العدد 
والتوع. 

القاحدة: يتبقي المطابقة بين عتصري الإسناد في 
الجطة في العدد والنوع. 

راجع لمزيد عن التغصيل: المبتدا والخبر/ كتاب 
النحو الوافي ل عياس حسن [مصدر /ر ايط] 
الشاهد الغصيح: “الَدِينَ آمَُوا يُعَاتِلُونَ فِي سَبِيلٍ 
اله" [سماع] 

خطا شائع: عدم المطابقة بين التراكيب المتلازمة 
مثل المبتدأ والخبر والصغة والموصوف. 


تكرار الخطأ لدى المستكدم: لا يقكرر. 


شكل رقم (17) لمعالجة المدقق النحوي كلمة ”يدافعان“ بهدف تعليمي. 


- وفي الجملة الآتية: ”الرجال الكريم يساعدون الفقراء “ خطأ بين فكلمة ”الكريم“ 
نعت مفرد يجب أن يتفق مع المنعوت الجمع ”الرجال“ في العدد» وصوابه ”الرجال 
الكرماء أو الكريمون ...“ 


الرجال الكريم يساعدون الفقراء 


Spelling and Grammar: Arabic (Saudi Arabia) 


Grammatical error: 


الرجال الكريم يساعدون الفقراء 


شكل رقم (18)لمعالجة المدقق النحوي التركيب" الرجال الكريم. 
ومثله كذلك: التطابق بين اسم الإشارة والمشار إليه في العدد. | في الجملة: ”ذهبنا 
إلى هؤلاء المعلم“. وصوابه: ”ذهبنا إلى هذا المعلم“. ومن التطابق بين عنصري الإسناد 


£ 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


التطابق بين الفعل والفاعل في النوع داخل الجملة: «كرهت الولد عصير البرتقال» 
وصوابه: «كره الولد العصير). 


*- الخطاً فى كتابة العدد بالحروف فى اللغة العربية: 
لكتابة العدد بالحروف العربية قواعد محددة من حيث تذكير العدد وتأنيثه حسب 
المعدود» وإفراد المعدود وجمعه حسب العدد» ويشيع الخطأ دائًا في هذه المسألة عند كتابة 


العدد بالحروف» ويمكن لأي مدقق نحوي - مستعيئًا بالمحلل الصرفي - أن يصحح 
أخطاء كتابة العدد سواء في تذكير العدد وتأنيثه أو إفراد المعدود وجمعه؛ فالجملة : «أصيب 


ما يزيد على سبع جنود» خط أ بين في العربية» وصوابها: «أصيب ما يزيد على سبعة جنود)؛ 
لأن العدد من ۳ إلى 4 يخالف المعدود في التذكير والتأنيث”". لكن ذلك يحدث دون أن 
يتعلم المستخدم القاعدة الحادية له في ذلك والآلية المقترحة تزود المستخدم بتأصيل علمي 
وتوثيق للمعلومة اللغوية» في خطوة تهدف لتطويع التقنيات اللغوية في تعليم العربية 
إلكترونيًا. ومن ثم تتعامل الآلية التعليمية مع الخطأ على النحو الآني: 


میج جدود اقتراح التصويب: سبعة 


البحث على الإتترنت: سبعة 


تحليل الخطأ: العدد سبع هنا يوافق المعدود في 
التذكير, والصواب أن يخالف المعدود في التذكير. 
القاعدة: العدد من 3 إلى 9 يخالف المعدود في 
التذكير والتأنيث. 

راجع لمزيد من التفصيل: العدد وتمييزه/ كتاب 
المصفى ل محمد عيد [مصدر/رابط] 

الشاهد القصيح: "سَخَرَهًَا عَلَيْهِمْ سَنْع لَيَالٍ وَنَمَانيَة 
آيَامِ حُسُومًا" [سماع] 

خطأ شالع: الخطأ في تذكير وتأنيث تمييز العدد من 
3 إلى 9. 


تكرار الخطأ لدى المستخدم: ثلاثة قنوات. 


شكل رقم (19)لمعالجة المدقق النحوي التركيبت “سبع جنود“ بهدف تعليمي. 


١‏ - راجع: النحو الأساسى» د. أحمد غختارء د. مصطفى النحاس» د. محمد حماسة» ص 0516 وما بعدها. 


-56- 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


سعى المبحث إلى إبراز دور تقنيات اللغة العربية الحاسوبية في التعليم الإلكتروني من 
خلال اتخاذ المدققات الإملائية والنحوية نموذجًا ومثالاء ولا يقتصر الأمر على تطبيقات 
التدقيق فحسب بل يمتدٌ إلى حركات البحث. وبرامج الترجمة الآلية» والمكانز والمعاجم 
أحادية اللغة (معاجم المترادفات والمتضادات) أو ثنائية اللغة (عربي - إنجليزي 
والعكس)» فهذه التطبيقات كذلك مما يمكن تطويعه ليفيد المستخدم العربي» ويكسبه 
معرفة بلغته الأم» وذلك بالتوازي مع الوظائف التقليدية هذه الأدوات والتقنيات. وما 
المبحث إلا نواة وفكرة يمكن تعميمها على كثير من التطبيقات والتقنيات اللغوية. 


¢» 


ا 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


المبحث الثاني 
تطوير التعرف الآلي على الحروف العربية 


0 


قك 

تعد عملية رقمنة مصادر المعلومات العربية أمرًا بالغ الآهمية» إذ يتم تحويل نصوص 
مصادر المعلومات الورقية إلى شكل إلكتروني مقروء من خلال المسح الضوئي 
للنصوصء وصولًا إلى نسخة إلكترونية مطابقة تماماً للنص الأصلي الموجود في صورة ( 
ملفات 04م - مز على سبيل المثال) . 

ومع ازدياد الحاجة إلى استرجاع المعلومات والبحث في مثل هذه النصوص» 
زادت الرغبة في رقمنة مثل هذه الملفات» وذلك من خلال إحدى البرمجيات أو 
التقنيات المتخصصة في التعرف الضوئى على الحروف Optical Character‏ 0010 
٠ . Recognition‏ 

وتقوم هذه البرمجيات بمجموعة من العمليات والخطوات التي تستهدف التعرف 
على الحروف. ومن ثم تحويل الصورة إلى نص يتضمن بيانات ومعلومات يمكن 
استرجاعها واستخلاص ما فيها. 

ومن هذه الخطوات تحسين جودة المخرجات ورفع كفاءة البرنامج عند التحويل» 
وذلك من خلال جود تقنية لغوية متقدمة تمكنه من التصحيح التلقائي لأخطاء القراءة 
دون الاعتماد على محلل صرفي ( أو مدقق إملائي يعتمد على محلل صرفي ) وذلك بناء 


-/اك- 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


على مجموعة من خصائص الحروف العربية» ومن ثم زيادة جودة هذه المخرجات» 
والوصول بها إلى أعلى درجة من الجودة. 

ويجدر بنا قبل أن نتناول وسائل تطوير تطبيقات التعرف الآلي على الحروف العربية 
وعلاج مشكلاتها؛ أن نعرض للأسباب المادية التي تؤدي إلى حدوث المشكلات أثناء 
عملية التعرف. 


الأسباب المادية لمشكلات التعرف على الحروف العربية: 

التباين الضعيف في ألوان أو «كونتراست» حروف الطباعة. 

وجود البقع السوداء على النص بشكل كبير. 

استخدام عدة أنواع من الخطوط ( كوي - أندلسي - فارمي... ) في النص نفسه» أو 
استخدام أشكال حروف نادرة» أو حروف بخط اليد» أو حروف مكتوبة بآلة كاتبة» أو 
تلك الحروف التى تأخذ أشكالا رسومية «جرافيك» يكون من الصعب على برمجيات 
“OCR)‏ ات عا أو آنا قخلط بها وين مقن النضص: 

احتواء النص على تنسيق غاية في التعقيد مثل (وجود عدة أعمدة رأسية» ووجود 
إيضاحات أو هوامش أو حواش في أماكن غير منتظمة» وغير ذلك)» فهذه العوامل ها 
تأثير سلبي على عملية التعرف الضوكي على الخروف. 

احتواء النص الواحد على العديد من اللغات المختلفة. 


مشكلات التعرف على الحروف العربية» وتكمن في: 

الخلط بين أشكال الحروف العربية المتشاءبة (حروف الالتباس). 

عدم اعتماد نموذج لغوي مدمج لحل المشكلات» والاعتاد على جهد المستخدم في 
التصحيح اللغوي اليدوي أو باستخدامه برامجَ التصحيح اللغوي الآلي. 

وسنعمد في هذا المبحث إلى اقتراح نموذج لغوي مدمج لحل مشكلات التعرف 
على الحروف العربية وفق مستويي النصوص المعالجة؛ مستوى النصوص غير المضبوطة 
بالشكل» ومستوى النصوص المضبوطة بالشكل» وفقا لخطوات معالجحة مرتبة. 


کے 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


أولا : معالجة النصوص غير المضبوطة بالشكل: 

طرق اكتشاف هذه المشكلات لغويًا ( وتكون من خلال عدة قواعد لغوية غير 
صرفية ) 

١-الحروف‏ المتعاقبة وغير المتعاقبة. 

- خروف الالتباس. 

۳- ترتيب الحروف العربية إحصائيًا حسب كثرة الدوران في العربية. 

5 - خصائص الحروف العربية من حيث الشكل والموضع من الكلمة. 

- توالي الأمثال في العربية. 


وذلك على التفصيل الآتي: 

© الحروف المتعاقبة وغير المتعاقبة:‎ -١ 

وهي خطوة تعتمد على الحروف العربية وإمكان اجتأعها مع بعضهاء ففيها ما لا 
يجتمع مطلقا بتقديم ولا تأخير في كلمة واحدة؛ كالثاء فإنها لا تجتمع بالذال والزاي 
والسين والصاد والضاد. وكذلك الجيم لا تجتمع بالطاء ولا بالظاء ولا بالغين ولا 
بالقاف ولا بالكاف» وكذلك الدال لا تجتمع بالظاء» ولا تجتمع الذال بالزاي والصاد 
والضاد والطاء والظاءء ولا تجتمع السين بالصاد والضاد والظاءء ولا تجتمع الصاد 
بالضاد ولا الظاءء ولا تجتمع الضاد بالشين والظاء» ولا تجتمع الطاء بالظاء» ولا تجتمع 
القاف بالغين ولا الكاف في كلمة أصلية. 

والحروف الحلقية لا يجتمع بعضها ببعض. إلا الهاء فإنها تعقبها هاء الضمير وهاء 
التأنيث وتعقب العين أصلية كالعهد والعهر» وليس في كلمة أصلية حرفان حلقيان 
سوى ما تقدم من الماء. 

ولا يجتمع حرفان من هذه الخمسة وهي الماء والطاء والعين والغين والخاء في ول 
كلمة سوى ما ذكر ولا في أثناء الكلمة إلا الهاء مع العين كهلع ... 


١‏ - راجع: استخدامات الحروف العربية (معجميًاء صوتيًاء صرفياء نحويّاءكتابيًا)» سليمان فياض» دار المريخ» السعوديةء 
:طض ۱۹ وما بعدها. 


حت 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


ولا تتقدم الثاء الشين» وكذلك الدال لا تتقدم على زاي ولا صاد ولا طاء» وعندما 
عربوا كلمة «مهندز» أبدلوا الزاي سينا فقالوا (مهندس». 

والذال لا تتقدم الجيم ولا السين ولا الشين ولا العين » والشين لا تتقدمها الزاي 
ولا السين ولا الصادء والطاء لا تتقدم الكاف في كلمة أصلية» والسين لا تتقدم على 
الدال» ويعرض الجدول الآتي للأوجه الصحيحة لتوالي الحروف العربية: 


الحروف التى لا تسبقه رك الحروف التى لا تتبعه 
وه و ش 
وا و ت 
ذ-ز-دس ص - ظ ث ذ-ز- س- ش - ص - ض - ظ 
ص - ظ -غ - ق - ك ج ض - ط -غ - ق- ك 
ست NS‏ 3 5 مه 
مدع جاجد 3 ا د 
د سداد ادس عدوي بد ذا 
بشن وح زص لاضن لط لظ وز ا ا ت د صن ان صن ص 
6 
ث- د - ذ- س - ص - ط - ظ 8 ث-ذ- س- ش - ص - ض - ظ 
ث - ذ- ز- ص - ض - ظ س ث- ز-ش - ص - ض - ظ 
ث - ذ- ز- س - ص - ض - ظ ل اش ض 
ددد کو دز دون دهن د طدظ ص ث- ج - ذ- ز- س- ش- ض - ط - ظ 
ث ج - د ذ- ز- س - ش - ص . ا ل 
e‏ ض ت - ذ- س - ش- ص- ظ - ق 
ج - د - ص- ظ ط باد ناي ق 2 
¥٩‏ 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


الحروف التى لا تسبقه 


تعد چ غ و دز دیس شن حصن 
دض -ع- ق- ك -ه 


€ 
ج = ج خ ذظ دع ق كه 
چ ظ 


ج < خ- ط- ظ-غ - ق 


حرف 


ك 


ه 


الحروف التى لا تتبعه 


أد ناث ود ذؤ- ز- س- ص - 
ض - ط - ظ -غ -ه - ي 


له جك جه 
ج = ج خ2 حك 


a 


CCC 


جدول رقم (۸) للأوجه الصحيحة لتوالي الحروف العربية. 


فمن خلال الجدول السابق إذن يمكن التعرف على الأوجه الصحيحة لتوالي 
الحروف العربية» ومن ثم يمكن حوسبة هذه القواعد وعرض مخرجات برامج التعرف 
الآلي عليها لأجل التحقق من صحة ودقة قراءة هذه البرمجيات بلا اعتماد على التحليل 


الصرني. ^ 


والسؤال المطروح هنا كيف يمكن الإفادة من الجدول السابق في اختيار أحد 
احتمالات الحروف المتتالية» ولذا يمكن الاعتماد على الإحصاء في ترتيب أكثر الحروف 
دورانًا قبل كل حرف وبعده» ويحتوي الجدول التالي على إحصاء لأكثر الحروف دورانًا 
مع بعضها (على مستوى الحرف الواحد)» ومن ثم يمكن التوفيق بينها وبين مخرجات 


البرنامج حال وجود الخظأ 9" 


١‏ - راجع: استخدامات الحروف العربية (معجمياء صوتياء صرفياء نحوياءكتابيا)؛ سليمان فیاض» ص 5 ١‏ وما بعدها. 
۲ - راجع: استخدامات الحروف العربية (معجمياء صوتياء صرفياء نحوياءكتابيا)» سليمان فیاض» ص 5 ١‏ وما بعدها. 


¥ 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


اا الحرف اا : ارا روف الحرف ا 
التي تأتي قبله التي تأتي بعده التي تأتي قبله التي تأتي بعده 
ن | ت ر فن ب 

ر ب ر ب طُّ ر 
ف ت ر ع ظٍ ظٍ 
ر ث 1 58 ع6 59 
وي چ ر ب ع مم 
3 ح م ن ف 0 
و ج ر و ر 
ر ل و ك ر 
و د ر ب م ل 
ف ل ب ر 3 3 
ر 9 زم ددع ن ب 
د ا اليم و ۴ 
ر ش ر ب 9 ر 
ص -و | ص ل 3 ي ب 


جدول رقم (4) لأكثر الحروف دورانًا قبل كل حرف وبعده 


ولكن أقصى استفادة من الجدول تتحقق بالاعتماد على جدول حروف الالتباس» 
وفق التفصيل الآتي: 


۲ - حروف الالتباس: 
وهي حروف متقاربة في شكلها الكتابي» وتتسبب عوامل كثيرة مادية في خلط 
اا و 


VY 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


الحرف| ا بات ج د ر س ص ط )ع إفا هاي ا 
احتمال | أ ي ن ح ذ ‏ ز ش ض ظ اغ ق ةة یس 
احتمال | ! 2 ف | ع باش 
احتمال | ل ق | غ ب 


جدول رقم )٠١(‏ للحروف الملتبسة وشبيهاتها في الشكل من الحروف. 


فبناءً على الخطوة الأولى الخاصة بالحروف المتعاقبة والحروف غير المتعاقبة» يفترض 
ألا تكون هناك كلمة فيها حرفان لا يجتمعان» وإذا ما حدث ذلك فيتم طرح البديل 
لأحدهما من خلال جدول إزالة الالتباس المعتمد على شكل الحرف المشبه للحرف 
المستبدل» واعتمادًا على خطوة لاحقة هي تقسيم الحروف العربية إحصائيًا حسب كثرة 
الدوران. 

وإنما اختصت هذه الخطوة بالحروف المتقاربة في الشكل فقط دون النظر إلى أي بعد 
لغوي؛ لاعتاد تطبيقات التعرّف على الحروف على شكل الحخرف ورسمه فقط. 


*- ترتيب الحروف العربية إحصائيا حسب كثرة الدوران في العربية: 

بعد أن أمكن -من خلال قائمة حروف الالتباس السابقة- استبدال الحروف التي 
تسبب مشكلة لغوية بحروف أخرى محتملة» تكون متشاببة من حيث الشكل وتسمح 
بها قائمة الالتباس» يمكن الاعتماد في المفاضلة بين احتمالات القائمة المتعددة على ترتيب 
الحروف العربية إحصائيًا وتقسيمها حسب كثرة الدوران إلى : 

حروف ذائعة الاستخدام : أ- د - م -ن -ل -ف. 

حروف متكررة الاستخدام : ه - و - ب. 

حروف مستخدمة : رع - ف - ت -ك - د - س - ق- ح- ج. 


١‏ - راجع: استخدامات الحروف العربية (معجمياه صوتيّاه صر فياه نحويّاءكتابيًا)؛ سليمان فیاض» ص ١9‏ وما بعدها. 


VT 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


حروف قليلة الاستخدام : ظ -غ - ط - ز- ث - خ- ض- ش- ص- ذ. 

ويتضح من الخطوات السابقة اعتادها على خصائص الحروف العربية 
الشكلية وتكراراتها في النصوص العربية» والتي تختلف عن الخطوات اللاحقة؛ إذ 
سيتحول التطبيق هذه المرة إلى خصائص الرسم الإملائي لبعض الحروف العربية» 
ومن ثم سيعتمد عليها في عملية التصحيح ورفع جودة تطبيقات التعرف الآلي 
غل ار وف العربية: 

- خصائص الحروف العربية من حيث الشكل والموضع من الكلمة 
(الحروف الاستهلالية - الحروف المتوسطة - الحروف المتطرفة): 

للحروف العربية خصائص من حيث الشكل والموضع من الكلمة» فهناك حروف 
تأتي في أول الكلمة فقط» وهناك حروف تأتي في أوسطها ومنتصفها فقط» وهناك 
حروف متطرفة لا تأني إلا في أواخر الكلمةء بل يتغير رسم الحرف باختلاف ترتيبه بين 
تدرو ا ا و او عابة.:ومفال ذلق الألقب أو إطيوة: 

حرف الألف أو الهمزة: 

تختلف أشكال كتابة (الألف أو الحمزة) ما بين [1أ-1-١-ءع-1آ-‏ ؤدئ -ى) 
وتأتي هذه الصور جميعها في بداية الكلمة ماعدا [ء - ؤ - ئ - ى ] ءوتأتي جميعها أيضا 
في وسط الكلمة ماعدا [ ى ]» وكذلك تأت جميعها في باية الكلمة ماعدا [ ! ] » وقد 
تجتمع أكثر من مزة في بداية الكلمة ولكن على النحو اأ - أئ - أؤ - | - آل ] . 

ومن ثم فإن أية احتمالات تخالف القواعد السابقة تعد خطأً؛ فعلى سبيل ال مثال: 

١‏ -إذا[بدأت الكلمة] [ب (ء) أو () أو (ئ)] فإن [الكلمة = (خطأ)]. 

۲- إذا كان [وسط الكلمة] [همزة بهذا الشكل (ء)] و[كان الحرف الذي يسبقها 
ليس ((1» أو «د» أو «ذ) أو «ر» أو «ز» أو «و»)] ؛ فإن [الكلمة = (خطأ)]. 

۳- إذا كان [وسط الكلمة] [(يء)]؛ فإن [الكلمة = (خطأ)]. 

- إذا كان [في أي موضع من الكلمة] [هذا الشكل (ءء) أو (11) أو (1) أو (آء) 
أو 99) أو (آئ) أو (أ) أو (1) أو (19) أو (5) أو (01) أو (أا) أو (١أ)]‏ فإن [الكلمة = 
(خطأ)]. 

ومن ثم يمكن لتطبيقات التعرف على الحروف العربية الاستفادة من قواعد الرسم 


-5/ا - 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


ع 
سس 


الإملائي في تحسين جودتها وتصحيح مخرجاتها الياء وهي الخطوة التي تقودنا نحو 
خطوة أخرى أو قاعدة لغوية أخرى يمكن الإفادة منها في تحسين مخرجات تطبيقات 
التعرف على الحروف؛ وهي قاعدة توالي الأمثال في العربية. 

ه - توالي الأمثال في العربية: 

برب العربية من توالي الأمثال في الحرفين أحياناء وتهرب منه بشكل قاطع في توالي 
۳ أحرف. ويمكننا حصر الحروف التي لا تتكرر مرتين» ومن ثم حذف ما سواها إذا 
جاء مكررّاء أما توالي ۳ حروف فممنوع في العربية منعا قاطعا مثل( للد ) في (للليمون) 
وصوابها (لليمون)» ومن ثم يمكن حذف ال حرف المكرر الثالث تلقائيًا. 


32009 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


ثانيا : معالجة النصوص المضبوطة بالشكل 

تمهيد: 

من الضروري قبل الحديث عن معالجة النصوص المضبوطة بالشكل أن نمهد ها 
بتمهيد؛ إذ تعد معالجة النصوص المضبوطة بالشكل الكامل مرحلة متقدمة عنها في حال 
النصوص غير المضبوطة بالشكلء فالنص غير المضبوط بالشكل يمثل صورة مبسطة 
من صور الحروف العربية التي تستطيع برامج التعرف الآلي على الحروف التعامل 
معها بيسر» أما النصوص المضبوطة بالشكل فهي نصوص تتسم بالتعقيد عند معالجتها 
بواسطة برامج التعرف الآلي على الحروف. 

وتجيد بعض برامج التعرف الآلي على الحروف التعامل مع النصوص المضبوطة 
بالشكل» ومن هنا نشأت الحاجة إلى عمل آلية مكملة للآلية الأولى الخاصة بزيادة الجودة 
لبرامج التعرف اللي على الحروف العربية» ولا تعتمد الآلية - حالها في ذلك حال الآلية 
الأولى - على التحليل الصرفيء وإنما على مجموعة من القواعد اللغوية الخاصة بشكل 
الحروف العربية» وترتيب ورودها واجتماعها في الكلام» وحركات ضبطها بالشكل. 
والآلية لا تضبط النصوص بالشكلء وإنما تسعى من خلال القواعد اللغوية المختلفة 
إلى التأكد من تكن (برامج التعرف الآلي على الحروف) من التعرف على حركات 
التشكيل في الكتابة العربية وتصويب الخطأ حسب قواعدهاء وسنعرض فيا يلي لبعض 
القواعد اللغوية الخاصة بالتعرف على حركات الضبط والتشكيل. 


١‏ -الخصائص العامة للحركات العربية (الكسرة - الضمة - الفتحة - السكون- 
الشدة) 

وأشكاها - على سبيل الحصر - هي: 7 كك م س 
١‏ - الفتحة والكسرة والضمة والسكون تأت في جميع مواضع الحروف من الكلمة 
(الحرف الأول والثاني والثالث؛ .. 

-١‏ التنوين بالفتحة والكسرة والضمة يأتي في نهايات الكلمة فقط (على الحرف 
الأخير) ولا يآتي التنوين في بداية الكلمة (على الحرف الأول) أو في وسطها (وقد يأتي 
التنوين قبل الآخر في حال التنوين بالفتحة فقط في إحدى صور كتابة التنوين بالفتحة). 


¥ 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


۳- التنوين بالفتحة يزيد حرفا هو الألف على الكلمة غير المنتهية بتاء مربوطة أو ياء. 
- السكون لا يأتي في الحرف الأول من الكلمة العربية» والقاعدة اللغوية في ذلك 
ماشهو رز لآ غد بساك 
قات لا يووا سداكتان ف العرية ( )ا 
- الشدة لا تأتي على الحرف الأول في الكلمة العربية؛ ذلك أن الشدة مكونة من 
حرفين: حرف ساكن+ حرف متحرك. 
۷- ألف الوصل لا تضبط بالشكل. 
هذه بعض الخصائص العامة للحركات العربية» لكنّ ها خصائص أخرى إضافية - 
لاسا الم .د الى فف اروف لحري ةقر هل ا عا 
بعال ملاعل الله 7 


خصائص الحركات العربية مع ا حروف (تطبيقا على ال همزة): 
احتهالات تشكيل الهمزة: "° 
يوضح الجدول التالي احتماللات ضبط الهمزة بالشكل وفق مواضعها المختلفة؛ ابتداءً 
وتوسطًا وانتهاء» ويوضح كذلك اختلاف شكل الهمزة نفسها باختلاف الحركات 
الاح عليها: 


أول الكلمة 


تقبل من الحركات 
الفتحة والضمة 


الكسرة فقط 


وسظ الكلمة 


تقبل من الحركات 
الفتحة والضمة 
والسكون 


الكسرة فقط 


آخر الكلمة 


تقبل من الحركات 
الاعيدة والضبية 
والكسرة 
والسكون وصور 
التنوين كلها 
لار 
الكلمة 


١‏ - راجع: الإملاء والترقيم في الكتابة العربية» عبد العليم إبراهيم» مكتبة غريب» القاهرة» ۱۹۷١‏ م. ص ٤٥‏ وما بعدها. 


الات 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


أول الكلمة 


لاتضبط 


لا تأتي في بداية 
الكلمة 


لا تأتي في بداية 
الكلمة 


لا تأتي في بداية 
الكلمة 


لا تأتي في بداية 
الكلمة 


جدول رقم )١١(‏ احتمالات ضبط الهمزة با 


وس الكلمة 


لا تضبط 


تقبل من الحركات 
اوا 

والتنوين بالفتحة مع 

إضافة الألف بعدها 


تقبل من الحركات 
الفتحة والضمة 
والسكون والتنوين 
بالفتحة مع إضافة 
الألف بعدها 


تقبل من الحركات 
الفتحة وا لضمة 
والسكون والتنوين 
بالفتحة مع إضافة 
الألف بعدها 


لا تأي في وسط 
الكلمة 


آخر الكلمة 


—VA— 


قبلها مفتوح دائ) 
وره ئ- 
ئ <= فى - ی 


لشكل وفق مواضعها المختلفة 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


ومن الممكن زيادة في الإيضاح؛ تفصيل الجدول السابق في عدة جداول أخرى على 


النحو الآتي: 
احتمالات تشكيل ال همزة فى أول الكلمة: 
| إما أن تكون مضمومة أو مفتوحة 
1 لابد أن تكون مكسورة 


جدول رقم )١١(‏ لاحتمالات تشكيل الهمزة في أول الكلمة 


ولا تأي همزة القطع في بداية الكلمة بهذا الشكل ( ؤ ) ولا بهذا (ئ) ولا بهذا (ء) 


ال همزة على آلف (أ): 
تشكيل الحرف الز 
شكلها تشكيلها 3 47 | عرف اللي يتنا 
| فتحة سكون 
ا فتحة أو سكون فتحة 
| فتحة أو ضمة كسرة لام الجر أو باء الجر 
جدول رقم (۱۳) لاحتمالات تشكيل الهمزة 
ال همزة تحت الألف (إ): 
2 5 تشكيل الحرف ۳ 1 3 
شكلها تشكيلها الذى يسبة الحرف الذي يسبقها 
لام التوكيد أو واو العطف أو فاء 
إِ كر فتحة العطف أو الكاف الجارة أو همزة 
الاستفهام 
إ كر كسرة اللام الجارة أو الباء الجارة 


جدول رقم )١5(‏ لاحتمالات تشكيل ال همزة المكسورة 


-4/ا- 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


احتمالات تشكيل ال همزة في وسط الكلمة": 
الهمزة التي على نبرة (ئ): 


1 0 تشكيل الحرف | ال حرف الذي | الحرف الذي بعد 
| ` الذي قبلها قبل ال همزة ا همزة 


3 
بل 


جا 


1 فيحة أوسكوة سس 

: فتحة كرون 2 مثال : هيئة 
1 0 5 ألف التنوين 
37 وین ی كرد (دفئا) 


يه 
U‏ 
س 
Le‏ 


ج - ع 

- س - رر = 
َّ کو ا آلف مد 
- ظ حع دغ مکافئات 

- ف - ق ك 

- ل = مدن 

ا 

ىِ بلا حركة (يا او ممدودة 
ضمة 537 5 ياء نمدودة 0 5 
مدية) بریئون 


. 0٥ 20 راجع: الإملاء والترقيم في الكتابة العربية» عبد العليم إبراهيم» ص ؟‎ - ١ 


دو/ ب 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


Le 


Le 


ككوة 


الذي قبلها 


ضمة أو سكون 


كسرة 


جدول رقم )٠١(‏ لاحتمالات تشكيل الهمزة التي على نبرة 


الحمزة التي على واو (3): 


3 


3 


r 


Gr 


Gr 


تشک 


جدول رقم )١١(‏ لاحتمالات تشكيل الحمزة التي على واو 


A1 -— 


الحرف الذي 
يسبق الهمزة 


ألف وصل في 
أول الكلمة 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


واو تمدودة 


ائذن 


الحرف الذى بعد 


الهمزة 


اؤمر 


الممزة على السطر (ء): 


: 8 تشكيل ارف | الخرك الدى. ٠‏ ارف التى يل 
١‏ الذي قبلها يسبقها ال همزة 
5 آلف نون( 
8 فتحة آلف بممدودة 0 حر 
جرت 
3 فتحة ألف ممدودة 
0 0 1 ألف تنوين (آخر 
5 : ا بد الكت 
سویں aE‏ 8 
و د-ذ-ر-ز-و ي 
3 فتحة ساكن وتو ر زو ألف ممدودة 
2 فتحة واو تمدودة 
5 ضمة ضمة واو تمدودة 
3 ضمة و ورزو واو تمدودة 


جدول رقم (17) لاحتمالات تشكيل الهمزة التي على على السطر 


احتمالات تشكيل الهمزة في آخر الكلمة: 


شكلها تشكيل الحرف الذي يسبقها الحرف الذي يسبقها 
25 كسرة 
و ضمة 
| فتحة 
3 سكون 
3 حرف مد (و-ا-ي) 


جدول رقم )١14(‏ لاحتمالات تشكيل احتمالات تشكيل الهمزة في آخر الكلمة 


-AY- 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


الخاتمة 


عرضنا في هذا المبحث لبعض وسائل تطوير التعرف الآلي على الحروف العربية» 
من خلال أداة لغوية غير صرفية» تتضمن قواعد الاكتشاف المبكر للأخطاء الناتجة 
عن التعرف الآلي على الكلام باللغة العربية دون الاعتماد على محلل صرفي» وذلك على 
مستوى النصوص المضبوطة بالشكل والنصوص غير المضبوطة بالشكل» وهي عملية 
ستسهم في تحسين جودة المخرجات ورفع كفاءة البرنامج» إذ توفر تلك الآلية المقترحة 
للمستخدم تقنية لغوية عربية متقدمة تمكنه من التحقق والتصحيح التلقائي لأخطاء 
القراءة دون الاعتماد على محلل صرفي في البداية» حيث يمكن - بالطبع في خطوة تالية - 
استخدام المحلل الصرفي لمعالجة خرجات آليتنا؛ توفيرًا للوقت والجهد في الترجيح بين 
الاحتمالات المتعددة (اللبس الصرفي)» فالكثير من احتمالات الخطأ قد حذفت» هذا إن 
لم يكن اللبس قد زال قبل مرحلة التحليل الصرفي. 


%۰ 


“AY 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


-/5- 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقيا أو تداولها تجاريا - 


الفصل الثالث 
آفاق استخدام بعض التقنيات اللغوية 
المبحث الأول 
مراجعة النص القرآني وتدقيقه آلا 
تمهيد: 
مع التقدم الكبير في استخدام وسائل التواصل الاجتماعي واستخدام المواتف 
النقالة الذكية» شاعت النسخ الإلكترونية المختلفة للقرآن الكريم -ومنها على سبيل 
المثال النسخ التي تعرضها متاجر (56056 ء1ملى . :2127 عاع600) - وشاع الخطأ 
فيها حتى غدت الحاجة ملحَّةً إلى آلية لغوية تمكننا من مراجعة النص القرآني كلمة 
كلمة بل حرفا حرفا وحركةٌ حركة» والتصديق عل صحته» وآئت فكرة هذا المبحث 
لتقترح آلية لغوية هدفها التدقيق الإملائي واللغوي للنص القرآني في نُسخه الرقمية 
برسمه العثماني. 
وتعتمد الآلية المقترحة في هذا المبحث في عملها على عدد من الأدوات الحاسوبية 
المقترحة التي اقترحت في مبحث سابق لتطوير آليات التعرف على الحروف: 
١-الأدوات‏ الإحصائية من خلال تطبيقات الإحصاء والفهرسة اللغوية: 
على مستوى الحرف. 
على مستوى الكلمة. 
على مستوى نهايات الآي وصفحات المصحف. 


-و6م/- 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


- الأدوات اللغوية من خلال عدد من الخصائص والقواعد اللغوية 
الحاسوبية: 
خصائص الحروف العربية. 
خصائص حر كات الضبط بالشكل (حركات التشكيل). 
خصائص الحركات العربية مع بعض ا حروف (تطبيقًا على الهمزة). 


۳ - أدوات معالجة الرسم العثاني آليّا من خلال حوسبة قواعد الرسم 
الم سكيد ين الريسه اللي لري 

ممصي رم 

- زيادة بعض الحروف. 

- كتابة الهمزة على غير القياس. 

اهال ا ف 

- الفصل والوصل بين أجزاء كلمات القرآن. 

ويمكن أن تصل كفاءة هذه الآلية إلى ما يقرب من ٠٠١‏ /» نظرًا لتطبيقها وتطبيق 
قواعدها اللغوية والإحصائية على القرآن الكريم فقط بوصفه نضا مغلقًا (01086©2 
.)٣ ×‏ غير قابل للزيادة أو النقص أو التغيير أو التبديل» وهو ما يعكس سهولة 
حوسبته ومعاحته آليّا ودقة النتائج وصدقها في الوقت نفسه. 


- 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


المقدمة 


يدف هذا المبحث إلى التعامل مع النص القرآني الرقمي بعيدًا عن النص المكتوب 
(أو المرسوم) بخط الخطاط في المصاحف الورقية» فلذلك طرق أخرى لعالجته من 
برامج التعرف الضوئي على الحروف »)0°۸R(‏ كما يدف إلى رفع جودة المراجعة 
لنص القرآن العظيم» والتأكيد على دقة النسخ الإلكترونية والمطبوعة لهذا الكتاب الذي 
لا يأتيه الباطل من بين يديه ولا من خلفه. والمبحث الذي بين أيدينا وإن قصد إلى 
آلية للتعامل مع الرسم العثاني للقرآن الكريم فإنه لا همل الرسم الإملائي الحديث 
لكلمات القرآن ويربطها مباشرة بمقابلاتها في الرسم العثماني. أما الأدوات التي تعتمدها 
الآلية في عملها فهي -على التفصيل- كا يأتي: 


١‏ - راجع: تطوير التعرف الآلي على الحروف العربية» عمرو جمعة عبد الرسول» الندوة الدولية السادسة لعلوم وهندسة 
الحاسوب» 7٠١٠١‏ تونس. ص 7550» وراجع أيضا: المعايير اللغوية والفنية لتقييم برامج التعرف الضوئي على الحروف 
العربية» عمرو جمعة عبد الرسول» مؤتمر جمعية هندسة اللغة العاشر» 76٠٠١‏ القاهرة» ص .١١١‏ 

-/اب/ - 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


الأدوات الحاسوبية المقترحة التى تنضمنها آلية تدقيق الملصحف: 

الأدوات الإحصائية: 

مقدمة فى التعريف بتطبيقات الإحصاء والفهرسة اللغوية': 

مهتم تطبيقات الفهرسة اللغوية بعملية التحليل الإحصائي لمفردات النصوص 
المعالجة من خلال إعداد فهارس هجائية لمفردات هذه النصوص» وتحديد عدد 
مرات تكرارهاء وتعرض هذه الفهارس في صورة قائمة مرتبة وفق الترتيب الهجائي 
التصاعدي أو التنازلي» أو وفق عدد تكرار الكلمات تصاعديًا أو تنازليّاء أو وفقا لطول 
الكلمة تضاهد ) أو كاز 


„° Textanz و‎ « ^Y , Y Concordance Version ومن أمثلة هذه التطبيقات”‎ 


برنامج Concordance‏ الإحصائي : 

يدعم البرنامج اللغة العربية وحروفهاء وتُدرج ملفات النصوص فيه بامتداد(.]6) 
فقطء إذ يقوم البرنامج بفهرسة الكلمات الموجودة هذه النصوص . والكلمة عنده: مجموعة 
من الحروف المتصل بعضّها ببعض» الواقعةٍ بين مسافتين قبلها وبعدهاء ويعرض البرنامج 
النص في شكل عمود واحد من الكلمات 11620170150 ويوضع أمام كل كلمة عدد تكرار 
هذه الكلمة في النص 710. » ثم يعرض نسبة مئوية لهذا التكرار بالمقارنة مع النص كله. 

برنامج 167683112 الإحصائي: 

يتميز برنامج 1'7]2112' عن برنامج 001٥00۲۵41٥8‏ بمعالجة التراكيب - إضافة 
إلى معالجة الكلات - فباختيار وظيفة 211356 » يعرض البرنامج التراكيب المتكررة 
في النص مصحوبة بعدد مرات تكرارها » وعدد كلمات التركيب. 

ويمكن للبرنامج تظليل الكلمات حل البحث ف مواضعها ف النص» ويتميز 
١‏ - راجع: مدونة معجم عربي معاصرء معالجة لغوية حاسوبية» المعتز بالله السعيد طه» رسالة ماجستير» كلية دار العلوم» 
جامعة القاهرة» /5417١ه/‏ ۷٠٠۲م»‏ ص19 وما بعدها. وراجع أيضا: اللغة العربية المعاصرة في المجال السياسي» دراسة 
لغوية حاسوبية من واقع ذخيرة لغوية» هبة سيد راشد» ص ٠۳۷‏ ۳۸ بتصرف. 
؟ - سيعرض الكتاب للتعريف بالتطبيقين في الفصل الثالث لمناسبة المقام هناك للاستفاضة في التعريف بما. 
/http: / /www.concordancesoftware.co.uk - ١‏ 


/http: / /www.cro-code.com /textanz.jsp - € 


-//- 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


البرنامج بميزة أخرى وهي 101115 95 وتختص بعرض الصور المختلفة للكلمة 
الواحدة» حيث يعرض للكلمات متشابهة الحروف في النص الواحد. فكلمات مثل: 
(إله)» امتا (وَإلَهْيْرٌ) تأي تحت ساق الكلمة «إله»» ويمكن التحكم في 
عدد حروف التشابه بتحديد أقصى عدد لحروف الكلمات المتشابهة أو أقل عدد لحروف 
الكلمات المتشامة. 

كيفية استخدام برامج الفهرسة والإحصاء في اكتشاف الأخطاء على مستوى 
الحروف والكلمات والآيات والصفحات: 

تتلخص فكرة استخدام تطبيقات الفهرسة الآلية في تدقيق النص القرآني في الاعتماد 
على فهرسة نسخة إلكترونية أصلية ومنقحة ومراجّعةٍ أكثر من مرة من القرآن الكريم 
برسمه العثاني» بوصفه نسخة أصلية يمكن القياس عليها وعدّها أصلاً ثم مقارنة أية 
نسخ جديدة بهاء وبإحصاءاتها المستخرجة من تطبيقات الفهرسة الآلية» ومن ثم فإن 
خطوات عملنا هي: 

توفير نسخة إلكترونية أصلية ومنقحة ومراجعة أكثر من مرة من القرآن الكريم في 
رسمه العثاني» وبامتداد .)× 

عمل عدد من الإحصاءات على هذه النسخة الأصلية (سيأتي شر حها بالتفصيل). 

عمل هذه الإحصاءات نفسها على النسخة المراد مراجعتهاء ذات الامتداد .)جا 

مطابقة نتائج إحصاءات النسخة المراد مراجعتها مع نتائج إحصاءات النسخة 
الأصلية. 

اكتشاف الاختلافات بين النسختين والتصحيح وفقا للنسخة الأصلية القديمة. 

الإحصاءات التي يمكن استخراجها باستخدام برامج الفهرسة الآلية والتي تفيد في 
مراجعة النص وتدقيقه آليّا: 

أ- إحصاء بالمجموع الإجماللي لعدد كلمات القرآن الكريم كاملا في رسمه العثماني. 

ب- إحصاء بالمجموع الإجمالي لعدد كلمات كل سورة من سور القرآن الكريم على 
حدة في رسمه العثماني. 

ج- إحصاء بالمجموع الإجمالي لتردّد كلمات القرآن الكريم كاملا في رسمه العثماني. 

د- إحصاء بالمجموع الإجمالي لتردّد كلمات كل سورة من سور القرآن الكريم على 


حدة في رسمه العثماني. 


-/4- 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


ه- إحصاء بالمجموع الإجمالي لتراكيب القرآن الكريم كاملا في رسمه العثماني. 
و- إحصاء بالمجموع الإجمالي لتردّد تراكيب كل سورة من سور القرآن الكريم على 


حدة في رسمه العثماني . 


مستويات التدقيق باستخدام تطبيقات الإحصاء والفهرسة اللغوية 

-١‏ التدقيق على مستوى حروف الكلمات القرآنية: 

ولا تقتصر عملية المصادقة والتدقيق على مستوى الكلمات القرآنية» بل تتجاوزها إلى 
حروف هذه الكلمات من خلال العديد من الإحصاءات والفهارس لحروف الكتاب 
العزيز» على النحو الآتي: 

أ- الحروف غير المتجانسة في العربية (الحروف عديمة الاتتلاف) 

في العربية حروف لا تجتمع مطلقا في كلمة واحدة: لا بتقديم ولا تأخير. وقد سبق 
عرض ذلك في مبحث تطوير آليات التعرف على الحروف العربية» وهي كا يأ 
اول ۰ 


الثنائيات - عديمة الاتتلاف 


س ث | س ذ اس ص س ض س ظ س ش ص ج ص ش طز دص ضق دض 
ث س | ذس ص س ض س ظ س ث س ض ط طاض ض ظ ظ ض ض شاش ضص 
ثذ | ثز إشثص/ثض/ ثظ | ذس | ظط طظ | ظج جظ ظد دظ 
ذث | زث اص ثاض ث ظث سث طح ظ ق ظش اخ څح غخ 
دكن کن | دتو نكن E‏ ارقن E PE‏ ةد قط 
وا دهن دق ارقم ]كنظ اس نانج ECE E EC‏ فخ 
E‏ اطق الس قت تك CCl E EOE‏ 
ص ضاض ص ص ط ط ص ص ظ ظ ص زص صز زط | ظز 

جدول رقم )3١(‏ لثنائيات الحروف غير المتجانسة في العربية 


http: //www.diwa -Î ١ 
.12-1-2014 في‎ alarab.com /IMG /pdf /I1s_hamaatUolamaaAltaumieat1-1.pdf 


4. 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


فهذه الثنائيات من الحروف العربية - كما ذكرنا من قبل - تتنافر فيع بينها ولا تجتمع 
في كلمة عربية أبداء ومن ثم فإن اجتماع مثل هذه الحروف غير المتجانسة في كلمة واحدة 
-بله في القرآن الكريم- يدل على وقوع الخطأ في الكلمة. 

ويوضح الجدول الآتي بطريقة أخرى الحروف التي تتآلف والأخرى التي تتنافر» 
من خلال حصر الحروف التى لا تسبق كل حرف من الحروف الحجائية العربية» وكذا 
ا ا ورياك ا ا 


الحروف التي لا تسبق 
SS as‏ 
و وض -تط-ظ 
ذ-دز-دس ص -ظ 
ص -ظ -غ - ق - ك 
شدخ = ظ دع = غ- هھ 
3 کی 15 كد 
ظَْ 
دو ر كفي دو ا طط 
ٿو سض طبظ 
تع دو دز دض عض اظ 
فو كين سن د ودل 
ث - د - ذ - ز - س -ض - ط - ظ 


ث - ج - د = ذ- ز - س - ش - ص 
- ط - ظ 


ج - د - ص- ظ 


حرف 


(CF 00 0 


EE الي‎ 


الحروف التي لا تلي 


ذ- ز- س- ش - ص - ض - ظ 
فن ط دن دك 
ود 5 25 ا 
أدح-غ-ك-ه 
حبذ عدون حون حاظ ب ظط 


ث ذ- س- ش - ص - ض - ظ 
ث- ز - ش - ص - ض - ظ 
ض 
ش-ج - ذ- ز- س- ش- ض - ط - ظ 
ت ذ - س - ش- ص- ظ - قا 


ت- ذ- ز - ص- ض - ظ - ك 


١‏ - راجع: استخدامات الحروف العربية (معجمياه صوتيّاه صر فياه نحويّاءكتابيًا)؛ سليمان فیاض» ص ١9‏ وما بعدها. 


4١ 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


الحروف التي لا تسبق حرف الحروف التي لا تلي 
ودع E‏ دوعا 1 اكد ديد - لديو موددني 
ص - ض - ع - ق- ك - ه -طدظدغ-ه دي 
يه 2 ننه هك نوه 
EEG ES‏ 5 8ك سمي سد 
د ق د 
ي ك 
e‏ 


جدول رقم )۲١(‏ لحالات اجتماع الحروف العربية مع بعضها 


ويّفاد من الجدولين السابقين التعرّفٌ على الأوجه الصحيحة لتوالي الحروف 
العربية» ومن ثم حوسبة هذه القواعد من خلال آلية مراجعة وتدقيق حاسوبية» تعتمد 


غل الأحضاء والفهرسة: 


ب- عدد حروف القرآن الكريم وأعداد تكراراتها: 

للإحصاء دور مهم في تدقيق حروف القرآن الكريم وتدقيق تكراراتها فيه فمجمل 
حروف القرآن ۳۳٠۷۳۳‏ » وأية نتيجة أخرى تنتج عن تطبيقات الإحصاء والفهرسة 
تعني وجود خطأ ما. ثم إن من الممكن التعامل مع عدد حروف سور القرآن سورة 
سورة» إمعانًا في المبالغة في تدقيق النص القرآني. 

وفي مرحلة أخرى متقدمة يمكن التصديق على عدد تكرار حروف العربية في القرآن 
في النص القرآني كله» وتأكيد صحتها في النسخة المراد مراجعتهاء من خلال مقارنة 
أعداد تكراراتها في النسخة المراد مراجعتها بأعداد تكراراتها في النسخة الأصلية الموثقة. 
ويبين الجدول الآني حروف القرآن الكريم مرتبة من الأكثر تكرارًا إلى الأقل تكرارًا. 


-Q- 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


.No 


۲١ 


۲ 


Letter 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


Frequency 


YY 
۸4۱ 
۷1 
1 
A1۳ 
1۹7۷ 
A0 
6۳ 
ل‎ 
۰0۰۱ 
۹۷ 
0 
414 


AVA 


م 


Percentage 


۳,۰۹4 
ل 
A,‏ 
A, °۸6‏ 
V,0۰۲‏ 
1,0 
EEE‏ 
۷0۰, 
ا 
۳,۵ 
ا 
ا 
0۷ 
1,10 
1,۷ 
۸۸ 
۱ا3۸ 
,ا 


١ 


Letter .No 
خ‎ ۳ 
0 ۲٤ 
ش‎ " 
ص‎ > 
1 >” 
ض‎ ۲۸ 
0 ۲۹ 
٠ 
ت‎ ۳١ 
ط‎ ۳۲ 
ع‎ 7 
ئ‎ ٤ 
ظٍ‎ 0 
امود و‎ 


Frequency 


4۹۷ 
YT 


YI 


VA 


Percentage 


0 ,م“ 
aE‏ 
7ه 
iS‏ 
۳م 
۰ 
۳ 
0 
۸ 
۵ 
۹ 
۸ 
۸ 


۷ 


جدول رقم (۲۲) لحروف القرآن الكريم مرتبة من الأكثر تكرارًا إلى الأقل تكرارًا 


بعد التحقق من تكرارات الحروف في القرآن الكريم كاملا والتصديق على صحتها 
في النسخة المراد مراجعتها يمكن الانتقال إلى مرحلة أخرى من التصديق على تكرارات 
الحروف العربية» لكن على مستوى كل سورة على حدة» ومن ثم ضمان تأكيد صحة عدد 
تكرارات الحروف في كل سورة بعد ضبان التأكد من التكرارات في النص القرآني كله. 


ج- توالي الأمثال (الحروف المتماثلة) في القرآن الكريم: 


ترفض العربية بشكل قاطع توالي الأمثال إذا توالت ثلاثة أحرف» وتكرهه في العربية 


-485- 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


إذاقوال oO E O‏ 
على سبيل المثال - تكون هكذا : (لليمون»» درءًا لتوالي الأمثال [ل(لام الجر) +ل(لام 
التعريف) +ل(لام الكلمة)] . فليس ثمة في العربية ثلاثة أحرف متاثلة في كلمة 
واحدة» والتأكد من خلو نسخة القرآن الكريم المراد مراجعتها من توالي ثلاثة أمثال في 
كلمة واحدة هي أولى خطوات هذه المرحلة. 
أما الحروف التي تتاثل في القرآن الكريم على مستوى حرفين فيمكن إحصاء عدد 
مرات تكراراتها مع أمثالها في القرآن الكريم كاملاء وني كل سورة من سوره» وهي 
خطوة أخرى من خطوات هذه المرحلة. والجدول الآتي يوضح أعداد تكرارات تعاقب 
الحروف العربية في القرآن الكريم مرتين مباشرة بلا فاصل في كلمة واحدة كا في (لل» 


مم نن » دده جج. ...): 
حرف اللام 7716 حرف الصاد ٠١١‏ حرف الكاف ٤‏ 


1 حرف الدال ۳۲ مرة. 9 
مره. ر مرات. 


حرف الفاء 10 مرة. حرف الياء 75 مرة. 


حرف الميم 7١4‏ مرة. 


حرف الألف ١91٠‏ 
مرة. 


حرف التاء 54 ١‏ مرة. 


حرف النون 57 ١‏ مرة. 


حرف الواو ٤٩‏ مرة. 
حرف الماء ٤۸‏ مرة. 


حرف الباء 64 مرة. 


حرف الراء ١‏ مرة. 


خرف السين ١5‏ مرة. 


حرف القاف 6 


حرف الطاء ۳ مرات. 
حرف الجيم مرتين. 
حرف الزاي مرتين. 


جدول رقم (۲۳) لعدد تكرارات توالي الأمثال في القرآن الكريم 


الخطوة التالية والأخيرة تتضمن حصر الحروف التي لا تتكرر مرتين في القرآن 
الكريم» ومن ثم تخطتتها إذا جاءت مكررة في النسخة المراجّعة» وهي على وجه الحصر: 
حروف الثاء والحاء والخاء والذال والشين والظاء والعين والغين وا همزة» فلم تقع 
جميعها متتابعة في القرآن الكريم كله" . 


. ۷۸ راجع: الإملاء والترقيم في الكتابة العربية» عبد العليم إبراهيم» ص‎ - ١ 
على‎ .۲٠٠٠ آذار‎ ٠١ راجع: التقاء الحروف المتماثلة في القرآن الكريم» د. محمد زكي خضر ء مجلة الفرقان» العدد‎ - ۲ 


ه06 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


"- التدقيق على مستوى الكلمات من خلال تحويل النص القرآني إلى قائمة 
کل |ٽ Text to list‏ : 

#بدف هذه الخطوة إلى تحويل كلمات النسخة الأصلية المراججعة من النص القرآني 
إلى قائمة كلمات طويلة» أو إلى جدول من عمود رأسي واحد» ثم تسهيل عملية المقارنة 
الآلية بينه وبين النسخة المراد مراجعتهاء والتي ستّحوّل أيضًا إلى قائمة عمودية من 
الكلماتء أو إلى جدول ذي عمود واحدء 5 حينئذ تحديد الخلايا الأفقية غير 
المتساوية في الخليتين الأفقيتين المتقابلتين في كل عمود منهما. 

والشكل الآتي يوضح جانبًا من هذه المقارنة بين نسختين إحداهما بالرسم العثاني 
والأخرى رقمية يراد تصحيحها. 


راق ر مره صر 
ريب ريب 
وء ر 

هدى هدى 


- N و‎ 
وی‎ e 
0 (۳ 


جدول رقم (۲۲) للمقارنة بين نسختين في عمودين» إحداهما مراججعة وصحيحة» والأخرى يراد تصحيحها. 


.12-1-2014 في‎ http: / /www.al-mishkat.com /khedher /wp-admin /Papers /paper18.pdf الرابط‎ 


کے 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


۳ - التدقيق على مستوى رؤوس الآي ونهايات الصفحات في مصحف 
المدينة من خلال تحويل النص القرآني إلى قائمة كلمات 156[ 60 )1 : 

بعد تحويل كلمات النسخة الأصلية المراجعة من النص القرآني إلى قائمة كلمات 
طويلة أو إلى جدول من عمود رأسى واحد وإجراء عملية المقارنة الآلية بينه وبين 
النسخة المراد مراجعتهاء وهي التي حُوّلت إلى قائمة عمودية من الكلمات أو إلى جدول 
ذي عمود واحد؛ يمكن بعد ذلك تحديد الخلايا الأفقية التي تحمل أرقام رؤوس الآيات 
غير المتساوية في الخليتين الأفقيتين المتقابلتين في كل عمود منها. 


الله َه د 
لمن | اق رب | ست | التي | رحن 
النَحِيم | اَي فل االكتريت | اقب | ابر 
O (»‏ )؟( 0 )۳( ;0 
ياك يك 
كر حك تَعْبّدُ َد هتا افد 


يوم 56 وَإِيّاكَ يأك الا اقرط 
الدينٍ آل دين َْنَعِيِبَ | الْمُسْتَقِيمَ | الستقم 
)0 


© 40 0 © (+) 


جدول رقم )٠١(‏ للمقارنة بين رؤوس الآيات في سورة الفاتحة في النسختين؛ الأصلية والمراد 
مراجعتها وتدقيقها 


أما تدقيق نهايات الصفحات في مصحف المدينة» فيمكن إجراؤه من خلال عملية 
(ترميز) وتعني وضع علامة معرّفة في بدايات ومايات كل صفحة من صفحات 
مصحف المدينة المنورة» وتحديد أول كلمتين في كل صفحة من صفحات القرآن الكريم 
في مصحف المدينة وآخر كلمتين بهاء وربط ذلك كله برقم كل صفحة» وبناء قاعدة 
بيانات بذلك لعقد مقارنة بين النسخة المراد مراجعتها وقاعدة البيانات هذه. 


-QV- 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


اا وا عليه EEE‏ زرم 


لاأسئوة © َم عل فو ھم وسن ول 
برهن كوعدا َيِه © ینای 
نيمل تاباش اليو الآي ماش يشؤميية © 
:| كيشو م ءالزن “ام راغوك لاشيم 
مانشد © ف ف بی م ادامرا 
وداب ريماو ايكذ بود © واي له 
انيد وأ الأرض ىيۈك © 
| ھڅ الشنیی كوك رک اجنود © ار 
لهم مائو مام الاش لوؤي نكناءامالشتهقً 
i ere‏ 9 اا 


کلی تر er ITTF‏ 
ذهب اف تورم رکم ف رة شذا 
بتو ومن © ازگتښت اام 
دورق وداس ایم لمي 

PEE‏ لت ا 
تنغ ااا کیم ترمد اعانا 4 
و اء ا هماک انه ملک 
عن وتر © بتأئيا اانا أعبدوارتك_البى علق |( 
لین تند تنفد @ ازى مزن |؟ 
ال ازس ور کا وا اء ا وأ ا ا مآ کج 
بمرت ردكا کل تنم وا ئناام 
نتئوت © ونڪ ف ر انار 


لْزِيَ E‏ 
| ىرۇ مَْوموذغوأ هد م ينثو نطو 
دَكْسْرْصبِقَِ ل فإ م موا ون تفعلوا اتا 
! قداو ونع الاش 5نا کرت 


شكل رقم )۲١(‏ لصفحتين متقابلتين من مصحف المدينة المنورة لشرح العلاقة بين رقم الصفحة 
وكلمات البداية فيها وكلمات نهاية الصفحة 


فالصفحة ٣‏ من مصحف المدينة المنورة تبدأ لال حَعَرُوا كمَرُوأ4 (البقرة CT:‏ وتنتهي 
ب (ومَاكَاوْأمُمََرت) (البقرة: »)١7‏ وكذلك الصفحة ٤‏ من مصحف المدينة تبدأ 

ب < ميركت الرى) (البقرة: 17) وتنتهي ب ادييت ) (البقرة: 74)؛ ومن 
ثم تعد هذه النسخة المرمّزة أصلا يمكن المقارنة به لاكتشاف الأخطاء في بدايات كل 
صفحات القران ونهاياتها حسب مصحف المدينة المنورة. 


- الأدوات اللغوية: 
وتتضمن كيفية الإفادة من الدراسات اللغوية الحاسوبية في عملية التدقيق لنص 
القرآن الكريم» من خلال بعض القواعد اللغوية الحاسوبية» كالقواعد النحوية 
والصرفية وقواعد الإعراب والضبط بالشكل» والاعتاد عليها بوصفها وسيلة من 
وسائل التدقيق والمصادقة لنص القرآن الكريم» وقد ذكرنا بعضها عند الحديث عن 
تطوير آليات التعرف على الحروف العربية. 


-4/- 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


أ- خصائص الحروف العربية: 

لبعض الحروف العربية خصائص من حيث الشكل والموضع في الكلمة» فهناك 
حروف يختلف رسمها باختلاف مكانهاء فترسم في أول الكلمة فقط برسم يختلف عن 
رسمها في وسط الكلمة عنه في آخرهاء فرسم احرف يتغير باختلاف ترتيبه بين الحروف 
الأخرى استهلالا أو توسطًا أو تطرفًا. وقد ضربنا مثالا بالهمزة عند الحديث عن تطوير 
تقنيات التعرف على الحروف العربية» فأشكال كتابة (احمزة) في العربية تختلف حسب 
موقعها في الكلمة كما ذكرنا هناك ''» ومن ثم فإن أية احتمالات تخالف هذه القواعد تعد 
خطاً إملاتيًا في رسم المصحف الشريف» فيصبح من السهل اكتشاف مثل هذه الأخطاء. 

ومن شأن تلك المعالجة لحرف الحمزة أن تمَكّن من اكتشاف الأخطاء في رسم 
الهمزات في النص الشريف» ثم تدقيق النص آليّا والتأكيد والتصديق على صحة همزاته 
استهلالية أو متوسطة أو متطرفة. 


ب- خصائص حر كات الضبط بالشكل (حركات التشكيل): 

يمكن أن نعتمد في تدقيق حركات الضبط والشكل في القرآن الكريم على بعض 
القواعد اللغوية الخاصة بالضبط والتشكيل» وقد تحدثنا عن ذلك في مبحث تطوير 
آليات التعرف على الحروف العربية» إذ عرضنا لخصائص علامات الضبط العربية 
(الكسرة - الضمة - الفتحة - السكون - الشدة) وأشكاها ومواضعها من بعض 
الحروف” "» ومن ثم يمكن للآلية المقترحة الاعتاد عليها في اكتشاف بعض الأخطاء 
في ضبط الشكل للنص الشريف. فأيٌّ خالفة لأيّ من هذه القواعد تعني خطأ إملائيا في 
ضبط نص المصحف الشريف يمكن للآلية المقترحة -من خلال هذه القواعد- اكتشافه 
سهولة: 

وقد ذكرنا هناك أن هذه الحركات خصائص إضافية - لاسيهما من حيث الشكل - إذا 
هي دخلت على ال حروف العربية» كل على حدة» وضربنا ال همزة مثالا تطبيقيًا على ذلك 


. 754 راجع: استخدامات الحروف العربية» سليمان فياض» ص‎ - ١ 


۲ - راجع: نفسه» ص ١١‏ . 


084 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


من خلال ذكر احتمالات تشكيلها باختلاف موضعها من الكلمة على النحو الآتي:“ 


الألف والهمزة 


r 


لا تأتي في بداية 
الكلمة 


لا تأتي في بداية 
الكلمة 


وسط الكلمة 


تقبل من 

الحركات 
الفتحة والضمة 

والسكون 


إضافة الألف 
بعدها 
قبل من 
الحركات 
الفتحة وا لضمة 
والسكون 
والتنوين بالفتحة 
مع إضافة الألف 
بعدها 
تقبل من 
الحركات 
الةو الضهة 
والسكون 
والتنوين بالفتحة 
مع إضافة الألف 
بعدها 


١‏ - راجع: الإملاء والترقيم في الكتابة العربية» عبد العليم إبراهيم» ص 55 وما بعدها. 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


دو و١‏ 


معنى ذلك أن 
صور ال همزة 
مضبوطة هكذا: 
ءءء لا تأي 
وسط الكلمة. 


الألف والهمزة 


ی (ألف تمدودة) 


أول الكلمة 


لا تأتي في بداية 
الكلمة 


وسنظ الكلمة 


تأي في وسط 
الكلمة 


آخر الكلمة 


لاتضبط 


قبلها مفتوح دائا 
وصوره : (فتحة) 
+ ی - (تنوين 
بالفتحة) + ى 
- (شدة وفتحة) 
EE‏ 

وتنوين بالفتحة) 

+ی 


جدول رقم )۲١(‏ لاحتمالات ضبط الهمزة والآلف وشكله| وفق مواضعهم المختلفة في الكلمة 


فالجدول السابق يوضح احتمالات ضبط الهمزة والآلف بالشكل وفق مواضعها 
اة واعكللاق شكل افم رت نقمها ياخعاذف ار كات الداغلة عليها. 

وهو ما فصلناه برسم العديد من الجداول التوضيحية في موضعه في مبحث تطوير 
التعرف على الحروف العربية"'. 


6 »0 راجع: الإملاء والترقيم في الكتابة العربية» عبد العليم إبراهيم» ص ؟‎ - ١ 


لاد 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقيا أو تداولها تجاريا - 


۳ - أدوات معالجة الرسم العثماني آليا: 

إن من المهم بعد حوسبة القواعد العربية والإملائية وتغذية آلية التدقيق الإملائي 
الآلي بها؛ أن تتضمن هذه القواعد قواعد الرسم العثماني لضمان تغطية كافة الاستثناءات 
الإملائية والكتابية لكلمات القرآن الكريم» التي خالف فيها الرسم العثاني الكتابة 
العربية. 


قواعد الرسم العثماني: 

لرسم المصحف العثاني قواعد أحصاها علماء الرسم العثاني في مؤلفاتهم'''» ويمكن 
إيجاز هذه القواعد في عدة أوجه على النحو الآتي: 

-١‏ الوجه الأول: الحذف 

- حذف الألف في قوله تعالى: 2[ الْصَلَمِيت » (لفاغة:۲) حيث حذفت الألف بعد 
العين» وقد كتبت كذلك في جميع مواضعها في القرآن» والأصل في كتابتها حسب الرسم 
الإملاتى (العالمين) ". 


قت القائية 


الرسم العثماتي الرسم الإملائي 


١‏ - من العلماء الذين أفردوا الرسم العثاني بالتأليف: الإمام أبو عمرو الدانيء المتوفى سنة 5 5 5ه في كتابه «المقنع في 
معرفة رسم مصاحف الأمصارء الإمام أبو محمد القاسم بن فيرّه الشاطبي» صاحب حرز الأماني» المتوفى سنة 055ه في 
كتابه «عقيلة أتراب القصائد في أسنى المقاصد. وهي نظم لكتاب المقنع المذكورء وما شروح كثيرة. الإمام محمد بن إبراهيم 
الأموي الشهير بالخراز» المتوفى في أوائل القرن الثامن ال حجريء في كتابه «مورد الظمآن»» وهو نظم بديع مشتمل على جل 
المسائل المذكورة في الكتب السابقةء وله شروخ منها: دليل الحيران» للشيخ إبراهيم بن أحد المارغني التونسيء المتوفى سنة 
۹ .. الإمام أبو داود سليمان بن نجاح. المتوفى سنة 447 ه» في كتابه «التتزيل» .العلامة أبو عباس المراكشيءفي كتابه 
«عنوان الدليل في رسوم خط التنزيل». العلامة محمد بن أحمد الشهير بالمتولي» في أرجوزته «اللؤلؤ المنظوم في ذكر جملة من 
المرسوم). العلامة محمد خلف الحسيني الذي شرح منظومته وذيل الشرح بكتاب أسماه: «مرشد الحيران إلى معرفة ما يجب 
؟ - راجع: دليل الحيران شرح مورد الظمآنء إبراهيم بن أحمد المارغني التونسي» مكتبة الكليات الأزهرية - القاهرة - 
١‏ مء ص 51 وما بعدها. 


و 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


- حذف الواو في قوله تعالى: «(ولغاؤید) <الشعراء:4؟) وقد وردت في موضعين من 
القرآن» والأصل فيها ( الغاوون ) . 
أَلْعَاوينَ الْعَاوونَ 
الرسم العثماني الرسم الإملائي 
- حذف الياء في قوله تعالى: أن (البقرة:71) وقد وردت كذلك في جميع مواضعها 
5 القرآن» وعدد موا ضعها ثلاثة عكر وشا والأصل في كتابتها ( | لنسق)77: 
النبيكن النبيين 
الرسم العثماني الرسم الإملائي 
- حذف اللام في قوله تعالى: اللي «آل عمران:160) وقد كتبت كذلك في جميع 
مواضعهاء وعددها ثلاثة وسبعون موضعًاء والأصل فيها ( الليل ) ". 


ن س0 
e‏ ر نا 
الرسم الغثماني الرسم الإملاتي 


- حذف النون في قوله تعالى: #إنجى» (الأنبياء:۸۸) وهو الموضع الوحيد في 
القرآن» الذي حذفت فيه النون من ثلاثة مواضع وردت فيه الكلمة» والأصل في 
رسمها (ننجي ) . 


7 4. 
ز 
ی جي 
الرسم العثماني الرسم الإملائي 


.۲۰۳-۲۰۲ راجع: نفسه» ص‎ - ١ 
.۱۹۹-۱۹۷ راجع: دليل الحيران شرح مورد الظمآن » إبراهيم بن أحمد المارغني التونسي» ص‎ - ۲ 

۳ - راجع: نفسه» ص ۲۰۷-۲۰۵. 

5 - راجع: نفسه» ص -١151١.ء‏ وراجع: البرهان في علوم القرآن» محمد بن ادر بن عبد الله الزركشي» تحقيق: محمد 
أبو الفضل إبراهيم» دار المعرفة - بیروت» د.ط » ١۳۹۱‏ ه /١‏ 08-1288 5» والإتقان في علوم القرآن» عبد الرحمن بن أبي 
بكر» جلال الدين السيوطي» تحقيق: محمد أبو الفضل إبراهیم» دار التراث» د.ط» د.ت» 51/4 .190-١‏ 


e 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


؟- الوجه الثاني: الزيادة 
وتكون في الألف. والواوء والياء. 
> الزيادة فى الأ كوله تال وا اترم ورذت: ف مرضعين: 
والأصل فيها ( وجيء )20. 
وَجِأَىَءَ وڃيءَ 


الرسم العثماتیى الرسم الإملائني 


2 
- الزيادة في الواو» قوله تعالى: « سوؤرب » (الأعراف:50١)‏ وردت في موضعين» 
والأصل فيها «(سأريكم)”". 
لش ع e‏ ° 
سأؤریگ ساريكمم 


الرسم العثماني الرسم الإملائي 


- الزيادة في الياء» قوله تعالى: ل يي (الذاريات:47) وهو الموضع الوحيد في 
القرآن» والأصل فيها (بأيد)””". 


5-4 
أده ٠.‏ 
سد بايد 
ر ۰ ر ge‏ 
الرس م العقمانى الرس الإملائي 


۳- الوجه الثالث: الهمز 
حيث وردت الهمزة في الرسم العثاني تارة برسم الألف. وتارة برسم الواوء وتارة 
ترصن الام 


.7 50 7 57 راجع: دليل الحيران شرح مورد الظمآن » إبراهيم بن أحمد المارغني التونسبي» ص‎ - ١ 

۲ - راجع: نفسه» ص ۲٥۹۹‏ . 

۳ - راجع: نفسه» ص 757. وراجع: البرهان في علوم القرآن» محمد بن بهادر بن عبد الله الزرکشي» (۱/ ۳۸۸-۳۸۱)» 
والإتقان في علوم القرآن» عبد الرحمن بن أبي بكر جلال الدين السيوطي» .)٠١١-٠١١/٤(‏ 


= 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


- ورودها ألما في قوله تعال: +(2 وا € (القصص:7) وهو الموضع الوحيدء 
والأصل فا( ك 
I‏ 2 
انوا توء 


الاسم العثمانى الاسم الاملائى 


E 
ورودها واوًا في قوله تعالى: ل يدوا (يونس:٤) وهي كذلك في مواضعها‎ - 
0) الستة من القرآث» والأصل فيها (يبدأ)‎ 


Sry‏ هاه 
يبدؤًا يبدا 
الرسم العثماني الرسم الإملائي 


- مجيئها ياءً في قوله تعالى: قَإسَى)» (النحل: 40) وهو الموضع الوحيد من ثلاثة 


مواضع»والأصل فيها (وإيتاء)”" 
يت راء 
الرسم العثماني الرسم الإملاثي 


.٠٠١ راح جع: دليل الحيران شرح مورد الظمآن» إبراهيم بن أحمد المارغني التونسبي» ص‎ - ١ 
Y= ۲۲۲ راجع: نفسه» ص‎ - 5 


۳ - راجع: نفسه» ص 2357١‏ والإتقان في علوم القرآن عبد الرحمن بن أبي بكر» جلال الدين السيوطي» 4/ ١07-1057‏ 


١٠م‎ 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


4 - الوجه الرابع: البدل 

ويقع برسم الألف واوًا أوياءً. 

- محيئها واوًا في قوله تعالى: «ألصَاوْة) (البقرة:١)‏ وهي كذلك في جميع مواضعها 
الأربعة والستين» والأصل (الصلاة) ومثلها في ذلك «الرَكَة» (البقرة:١٤)‏ 


والأصل (الزكاة) . 


54 


- ومجيء رسمها ياءً في قوله تعالى: (يِكَأْسَفَ) <يوسف::1) والأصل فيها (يا أسفا) 9. 
یا أسقًا 


الرسم الإملائي 


2 جد 


الرسم العثماني 


ومن ذلك أيضاًء قوله تعالى: إوألسحى) (الضحى:١)‏ وم ترد إلا في هذا الموضعء 
والأصل فيها (والضحا)””". 


وصح والضحًا 


الرسم الإمَّلاتفق 


الرسم العثماني 


6- الوجه الخامس: الفصل والوصل 
فقد رُسمت بعض الكلمات في المصحف العثاني متصلة مع أن حقها الفصل» 


.۲۸۳-۲۸۲ راجع: دليل الحيران شرح مورد الظمآنء إبراهيم بن أحمد المارغني التونسي» ص‎ - ١ 
N راجع: نفسه» ص‎ - ۲ 
. ۲۸۱-۲۷۹ راجع: نفسه» ص‎ - ۳ 

| ٠ = 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


ورُسمت كلمات أخرى منفصلة مع أن حقها الوصل . 
- رسمتا متصلتين في مواضع» من ذلك قوله تعالى: يشما أَشَدَروَا)4 (البقرة:40) 
له ا 


ر 
الرسم العثماني الرسم الإقلائت 


والخلاصة أن حوسبة صور الكلمات القرآنية التي تختلف كتابتها في الرسم العثاني 
عنها في الرسم الكتابي إضافة إلى حصاء عدد مرات تكرارها برسمها العثاني وبرسمها 
الكتابي في حالة وجوده في المصحف الشريف من خلال برامج الإحصاء والفهرسة 
اللغوية؛ تعد أحد أهم عناصر آلية التصحيح والتدقيق الآلي للنص الشريف» فمن 
الممكن بسهولة التأكد من دقة الرسم العثماني في المصحف الشريف من خلال مقارنة 
قواعد البيانات التي في الآلية والتي تخص النسخة الحاسوبية الأصلية للقرآن الكريم 
بمثيلاتها في النسخة المراد تصحيحهاء ومن ثم اكتشاف الأخطاء في النسخ المراد تدقيقها 
وتصديقها. 


=¥ اك 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


عرضنا في هذا المبحث لمكونات آلية لغوية تمكننا من مراجعة النص القرآني كلمة 
كلمةء بل حرفا حرفا وحركةً حركةء والتصديق على صحته» وتهدف إلى التدقيق الآلي؛ 
الإملائي واللغوي للنص القرآني في نسخه الرقمية برسمه العثاني. وأوضحنا كيف 
تعتمد الآلية في عملها على عدد من الأدوات الحاسوبية المقترحة» وهي: 

الأدوات الإحصائية من خلال تطبيقات الإحصاء والفهرسة ا 

الأدوات اللغوية من خلال عدد من الخصائص والقواعد اللغوية الحاسوبية. 

أدوات معالجة الرسم الثاني آليّا من خلال حوسبة قواعد الرسم العثاني وأوجه 
الاختلاف بينه ويين الرسم الكتابي للعربية 

ويدعو المؤلف في كتابه إلى تبني الآلية وتوفير الدعم المؤسسي اللازم لها لأجل 
تنفيذها بوصفها خطوة أولى في طريق التدقيق الإملائي والنحوي للقرآن الكريم» كا 
يجدد الدعوة للباحثين لاستلهام النص الشريف بوصفه مادة خصبة للدراسات اللغوية 
الحاسوبية» التي يمكن من خلالها خدمة العلوم الإسلامية» ولاسي) القرآن الكريم 
والسنة الدبوية ال فة 


0% 


1 ° A- 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


الملبحث الثاني 


تحليل النصوص باستخدام تقنيات الإحصاء اللغوية 
والاستفادة منها في صناعة مناهج تعليم العربية المعاصرة 


0 


عهید: 

يعمد هذا المبحث إلى تحليل مدونة لغوية للعربية باستخدام إحدى التقنيات اللغوية 
الحاسوبية؛ وهي تقنية الإحصاء والفهرسة اللغوية» بهدف المساعدة في تعليم العربية 
وتوفير مناهج عصرية لتعلم اللغة العربية المعاصرة» تكون مبنيّة على تحليل البيانات 
الضخمة لأجل التعليم والتعلم. فالمبحث يخرج بمجموعة من الإحصاءات الضرورية 
واللازمة في تعليم العربية المعاصرة للناطقين بها أو بغيرهاء ومنها - على سبيل المثال - 
الخروج بإحصاء عن أكثر ٠٠٠١‏ كلمة تكرارًا في اللغة العربية المعاصرة» وكذلك أكثر 
٠‏ متلازم وأكثر ٠٠١‏ مسكوك استخدامًا في العربية المعاصرة» وأخيرا أكثر ٠٠١‏ 
أداة نحوية استخدامًا في العربية؛ وهو أمر ذو بال في تعليم اللغة العربية للناطقين بها 
وبغيرهاء وهذا سيساعد في تحديد الكلمات الأساسية لمتعلم العربية المعاصرة» ومن ثم 
يمكن للمعلمين وللمتعلمين التركيز على هذه الكلمات عند التعليم والتعلم» بل يجعل 
اللغويين ينطلقون من هذه الكللات نحو معجم سريع وعصري للعربية المستخدمة 
أسوة بغيرها من اللغات التى سبقت في هذا المجال. 

والح الى ون | انها يدرت اشرات ال ارو اال هذه الغا 
السابقة وغيرها من خلال استخدام تقنيات الإحصاء والفهرسة اللغوية في معالجحة 


1١٠804 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


مدونة لغوية Corpus‏ تضم مستويات لغوية مختلفة وجاللات دلالية مختلفة» حيث 
تؤدى قات الفهرسة اللغرية غملية الل الأ عصان ردات النصوض العاطة: 
من إغداد هاري لتردات هله النصوضن مرق غلة مراك را رها ومن م يمكن 
عرض هذه الفهارس في صورة قائمة عمودية مرتبة وفق الترتيب اللهجائي التصاعدي أو 
التنازلي» أو وفق عدد تكرار الكلمات تصاعديًا أو تنازلياه أو وفق طول الكلمة تصاعديًا 
أو از لاء ومن آهم أمثلة هذه التطبيقات الإحصائية 17615101 Concordance‏ 
.P Textanz ge FY‏ 


/http: / /www.concordancesoftware.co.uk يمكن تحميله من خلال الموقع:‎ - ١ 
http: / /www.cro-code.com /textan7z.jsp يمكن تحميله من خلال الموقع:‎ - ۲ 


= 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


محتوى المبحث 


مقدمة. 
من الدراسات السابقة. 
التعريف بالأدوات والتقنيات المستخدمة في الدراسة. 
عرض تفصيلي لأهم تطبيقات الفهرسة الإحصائية 
د نامج Concordance‏ 
برنامج 16763112 (البرنامج المستخدم في المبحث). 
مقدمة في التعريف بالمدونات اللغوية وأهدافها. 
التعريف بالمدونة المستخدمة (مدونة لطيفة السليطي) في الدراسة: 
خطوات معالجة المدونة اللغوية باستخدام تقنيات الفهرسة والإحصاء اللغوية. 
البيانات التي يمكن استخراجها باستخدام تطبيقات الإحصاء الآلية (إجمالا): 
إحصاء بأكثر ٠٠٠١‏ كلمة تكرارا في اللغة العربية المعاصرة. 
إحصاء بأكثر ٠٠١‏ متلازم استخداما في العربية في المعاصرة. 
إحصاء بأكثر ٠٠١‏ مسكوك استخداما في العربية في المعاصرة. 
إحصاء بأكثر ٠٠١‏ أداة نحوية استخداما في العربية. 
- بيان كيفية الاستفادة من مخرجات تقنيات الإحصاء في مناهج تعليم العربية 
للناطقين بالعربية أو بغيرها. 
ج النتائج والتوصيات. 


ج 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


لقد غدت الحاجة ملحَّة إلى أفكار جديدة في صناعة المناهج الدراسية؛ استنادا إلى 
الواقع المعيش والمواد المستخدمة» وذلك لتفعيل أثر هذه المناهج الدراسية في حياة كل 
المتعلمين والإفادة ما تعلموه في حياتهم» ومن ثم جاءت فكرة هذا المبحث بالبحث عن 
منهج معاصر للعربية يعتمد على المستخدم من كلماتها وتراكيبها وقواعدها النحوية. 

وليس أيسر من استخدام التقنيات الحديثة في اكتشاف هذه المناهج وصياغتها 
لتقديمها للدراسين» فيمكن من خلال استخدام تقنيات الإحصاء والفهرسة اللغوية 
الكشف عن أكثر الكلمات والمتلازمات والمسكوكات والأدوات النحوية استخدامًا في 
العربية المعاصرة من خلال الاعتماد على مدونة لغوية عربية معاصرة. وهو موضوع 
مطروح في عدد من اللغات الأجنبية ومنه على سبيل المثال - معجم كوبيلد الإنجليزي 
التعليمي - كا سيأتي في الدراسات السابقة. 


-1١١5- 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


من الدراسات السابقة: 


مشروع معجم كوبيلد الإنجليزى التعليمى ‘:COBUILD English Dictionary‏ 

مشروع كبير» أنجزته مؤسسة كولينز - كوبيلد .0081711 وصناآه0 الإنجليزية» 
المعاصرة» يساعد متعلميها - من أهلها ومن غير أهلها - على فهم أعمق لتراكيبها 
واستعمالاتها اللغوية بعد حصر المفردات والتراكيب الشائعة» وبيان نسبة شيوع كل 
منها؛ كا اهتم صانعو المعجم بوضع أكبر عدد تمكن من الاستعمالات اللغوية لأقل عدد 
من المفردات» وهو ما يجعل تعلم اللغة والتمكن منها أمرّا ميسورًا. وقد نشر معجم 
كوبيلد الإنجليزي التعليمى English Dictionary Helping Learners With Real‏ 
اوناع« للمرة الأولى عام ۱۹۸۷ م» واعتمدت الطبعة الأولى على مدونة مكتوبة من 
١‏ مليون كلمة» معت من مصادر إنجليزية عديدة تنما نشر حتى الثانينيات من القرن 
الماضيء وأعيد نشر المعجم مرة أخرى عام ١٠٠٠م,‏ بإشراف المعجمي الإنجليزي - 
الإسكتلندي الأصل - جون سينكلير 51201211 01[ 1١97*(‏ - ۲۰۰۷م) - الذي 
كان أستاذا للإنجليزية المعاصرة بجامعة برمنجهام حتى وافته ا لمنية عام N ٠۷‏ بعد 
زيادة حجم مدونة المعجم إلى مائتي مليون )350٠<٠٠٠٠١(‏ كلمة'''. (ويعد معجم 
كولينز - كوبيلد واحدًا من أهم المعاجم الإنجليزية» يحظى بانتشار واسع في جميع أنحاء 
العالم؛ فلقد فطن صانعوه إلى المشكلات الأساسية في تعلم اللغة» وإلى أهمية الاستعمال 
اللغوي والوصف البراجماتي لمفردات اللغة» ووضعوا أسس وقوانين وإحصاءات 
وصلت بالمعجم إلى درجة عالية من الجودة والإتقان» فخرج كبير الفائدة» سهل 
الاستخدام» بکلات شائعة» وتعبيرات وأاضحة» وقواعد نحوية ميسرة» واستعالاات 
لغوية منتقاة) . 


١‏ - راجع: مدونة معجم عربي معاصرء معالجحة لغوية حاسوبية» المعتز بالله السعيد» ۷ ۰م. ص1۹ ومابعدها. 
Collins COBUILD York: English Dictionary Helping Learners With Real English. London.‏ -2 
Introduction of Dictionary. Sincliar, J. and Others. (2000). P. viii.‏ 


۳ - راجع: مدونة معجم عربي معاصر» معالجحة لغوية حاسوبية» المعتز بالله السعيد» ص59 وما بعدها. 


= 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


التعريف بالأدوات والتقنيات المستخدمة في الدراسة: 

مقدمة في التعريف بتقنيات الإحصاء والفهرسة اللغوية“ 

وذ تطعا ت النورية التحضافة غماة العمل 'الامصناض ك دات التصوضن 
اا ا اسرد ركديد عد ور اك كرارها 
في هذه النصوص» وتعرض هذه الفهارس في صورة قائمة مرتبة وفق الترتيب ال هجائي 
التصاعدي أو التنازلي» أو وفق عدد تكرار الكلمات تصاعديًا أو تنازليّاء أو وفقا لطول 
الكلمة تصاعديًا أو تناز" . 

وتتيح هذه البرامج إمكانية حصر كلمات بعينها من خلال قائمة]15آ )ذ۴ » أو 
استبعاد كلمات بعينها من خلال قائمة ئا 5]07. 

.‘Textanzg “7: , Y Concordance ١7151011 ومن أمثلة هذه التطبيقات‎ 


عرض تفصيلي لأهم تطبيقات الفهرسة الإحصائية 

Concordance برنامج‎ - ١ 

يدعم البرنامج اللغة العربية وحروفهاء وتُدرج ملفات النصوص فيه بامتداد(.]6) 
فقط» حيث يقوم البرنامج بفهرسة الكلمات الموجودة بهذه النصوصء والكلمة عنده: 
مجموعة من ا حروف المتصلٍ بعضها ببعض» الواقعة بين مسافتين قبلها وبعدهاء ويعرض 
البرنامج النص في شكل قائمة واحدة من الكلمات (1162077050) ويوضع أمام كل كلمة 
عدد تكرار هذه الكلمة في النص في قائمة »).N0(‏ ثم يعرض نسبة مئوية لهذا التكرار 


١‏ - راجع: نفسه» ص59 وما بعدهاء وراجع أيضا: اللغة العربية المعاصرة في المجال السياسي» دراسة لغوية حاسوبية من 
واقع ذخيرة لغوية» هبة راشد» ص 27737 ۳۸ بتصرف. 

۲ - راجع: اللغة العربية المعاصرة في المجال السياسي» دراسة لغوية حاسوبية من واقع ذخيرة لغوية» هبة راشد» ص ۴۷» 
۸ بتصرف. وراجع أيضا: مدونة معجم عربي معاصرء معالجة لغوية حاسوبية» المعتز بالله السعيد» ص59 وما بعدها. 
۳ - يمكن الحصول على البرنامج من خلال الرابط 

.12-12-2013 في:‎ /http: / /www.concordancesoftware.co.uk 

٤‏ - يمكن الحصول على البرنامج من خلال الرابط 

.12-12-2013 في:‎ http: / /www.cro-code.com /textanz.jsp 

5 - عرض الدكتور المعتز بالله السعيد لبرنامج Concordance‏ في رسالته للاجستير» مدونة معجم عربي معاصر» معاحة 
لغوية حاسوبية» ص *الاء .۷٤‏ 


= 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


بالمقارنة مع النص كله في قائمة (/)» وذلك كا في الشكل: 


„Context 


,الولايات المتحدة قرارات استهدفت حزب اق وإعتبرتها الجماعة المدعومة من ايران اعلان حرب 

ابران اعلان حرب 

.. مابو ايار اعلئت الحكومة التي تخوض باشل صراعا منذ ١١‏ شهرا مع تحالف سارض بقبادة حزب اله ان شبكة 
حزب الل 

قوة غير نظامية إن خاني الحكومة قراراتها ودعا إلى عق محادثات جهدف انماء الازمة امسياسية. 

المواجهة 

هايو ايار علنا رة الاولى ان الجماعة ستمدة لاستخدام بنادقها ضذ خصوم محلبين في دواجهة تهذيد لترسافته. 
فصائل حليفة من جانب ودقائلين مؤيدين الاثتلاف العاكم من جانب اخر. ولا شك في امسيطرة السكرية لعزب | 
...جانب ودقاقلين مؤيدين الائتلاف الحاكم من جافب اخر. ولا شك في السبطرة السكرية لحزب ال في حين ان قوة 
.جاقب اخر. ولا شك في السيطرة السكرية لحزب انه في حين ان قوة الفصائل المؤيدة للحكومة ليست وإاضحة, و 
الدرجح ان بحتفظ حزب ال بقبضته على طرق ببروت بها يمني اغلاق المطار من الناحية اعلية, ويمكن لجماعة 
الناحية القسلية. ويدكن للجماعة وحلفائها المممارضين د عوة اتباعهم الأين يعملون لذى للحكومة الى عذم الأهاب الى 
اضعاف المؤسسات الحكومية. ويدكن ان ينحرك حزب الل للسيطرة فليا على مباني الحكومة. لكن من غير ارجح 
... غير المرجح حدوث خعرك لافتحام النقار الرئيسية للحكومة التي يشفلها رئيس الوزراء فؤاد السنيورة. ورغم سيط 
... غير الفرجح جدا ان بحاو حزب الك الاستيلاء بصورة كاملة على الحكومة بالصورة التي سبطرت بها حركة حما 
ارجح ان تبقى حركة اعضاء الحكومة ومنهم الستيورة مغيدة الى حد كبير وستانع الازهة الحكومة من اتخاذ قرار 
انخاذ قرارات سياسية مهمة. ورغم قراراتها يوم المساذس هن مابو الا ان الحكومة على الازضن اضدف من ان يمل 
هايو الا ان المكومة على الارض اضعف من ان يمكنها اتخاذ خطوات تجاه تفكيك شبكة اخصالاث حزب ال او ات 
ان يمكنها اتخاذ خطوات تجاه تفكيلك شبكة اتصالاث حزب الك او انخاذ اجراءات قانونية ضط المشاركين فيها 
"ايى وطرح زعيم الاثتلاف الحاكم سعذ الحريري افتراحا يوم الخميس يدقبر الأزارات "سوء تفاهم 

...هايو بها قد يسمح باسكناف الجهود لحل الصراع السياسي الاوسع بشن كيغية تقاسم السغطة في حكومة جديدة و 
.ملي لا حل لكن لا تصعيد. وسيترك ذلك جزءا كبيرا من الحكومة مشلولا كما سيترك البلاد بدون ريس 
الحكوفة مشاولا كما سيترك البلاذ يدون ركس 

الولايات اللمتحدة قرارات استهذفت حزب اث وإعتبرتها الجماعة المد عوهة من ايران اعلان حرب 

ابران اعلان حرب 

مابو ايار اعلنت العكومة التي تخوض باشل صراعا منذ ٠۷‏ شهرا مع حالف سارض بقيادة حزب إن ان شبكة 
إحزب ال 

قوة غير نظاهية إن علني الحكومة قراراتها ودعا إلى عق محادثات بهدف انهاء الازمة امسياسية 


...هايو ايار عفنا للمرة الاولى ان الجماعة مستعدة لإستخدام دنادقيا ضد 
.. قصائل حليفة من جائب ومقاتلين مؤيدين الاك 
...جائب وهقائلين مؤيدين ادلات الحاكم من + تفل 
.جاقب اخر. ولا شك في السيطرة السكرية. 
المرجح ان يح حزب ال بقيضته على 
الناحية الفعلية. ويمكن للجماعة وحلفائها العمار 


...غير المرجح حذوث تحرك لاقتحام النقار الرئ 
... غير المرجح جدا ان يحاول حزب اله الاستيلا 
.المرجح ان تبقى حركة اعضاء الحكومة ومنهم| 
.اتخاذ قرارات سياسية مهمة. ورغم فرازاتها 


غير المرجح جدا 


Context... 
رويترز) - تصاعدت اسو ازمة داخلية في لبنان من العرب الاهلية (2 110-1507 ) بصورة حادة هذا الاسبوع‎ ... 
بصورة حاذة هذا الاسجوع ج‎ )1۹۹ ١-٠۹۷ ©( «رومترز) - قصاعدت اسوأ ازمة ذاخلية في لبنان منذ الحرب الاهلية‎ 
وفي يوم السلا‎ 
شهرا هع تحالف معارض بقباد‎ 1١ .وقي يوم السادس هن مابو ايار إعلنت الحكومة التي تخوض باشل صراعا مذ‎ 
وطلب حزب ال وهو حركة سياسية لها جي قوي بتألف‎ 
ترفضن الحكومة مطالب حزب ال. وترفض الجماعة بدورها التراجع. سيشهد لبنان حينلأ هزيذا‎ 
.- قال زعيم حزب ال حسن نصر ال يوم الان‎ 
.- ...قال زعيم حزب انك حسن نصر اث يوم الثامن من مابو ايار علنا للمرة الاوثى ان الجماعة مستطة لاستخدام بقائق‎ 
.- ...قال زعيم حزب الك حسن نصر الك يوم الثامن من هايو ايار علنا لليرة الاولى إن الجماعة مستعدة لاستخام ينا‎ 
.- ...قال زعيم حزب ال حسن نصر ات يوم الثامن من هايو ايار علنا للرة الاولى ان الجماعة مستدة لاستخدام بنا‎ 
- من المرجح ان يحتفظ حزب الك بقبضته على طرق ببروت يما يعني اغلاق النطار‎ 
.-. ...من ارجح ان يحنفط حزب انك بقبضته على طرق بيروت بها يعني اغلاق المطلر هن الناحية الفعلية. ويمكن للجها‎ 
.- .هن المرجح ان يحففظط حزب إل بقبضته على طرق بيروت بما يعني اغلاق المطار من الناحية الفعلية. ويمكن لل‎ 
.- ...هن العرجح ان بحت حزب اث بفضته على طرق جيروت جما يمني اغلاق المطار من الناحية الفعطية. ويمكن لل‎ 
.- .ستبقى الحكوهة التي تطعن المعارضة في شرعيتها في اللسلطة. سيقدم مساندون دوليون هنهم الولايات المتحدة و‎ 
ستبقى الحكومة التي تطعن المعارضة في شرعيتها في امسلطة. سيقم مساندون دويون منهم الولايات ا‎ 
.- ...ستبقى الحكوهة التي تطعن النعارضة في شرعيتها في اللسلطة. سيظم مسافنون دوليون هنهم الولابات المتحدة و‎ 
مستجيب اكتلاف زعماء لبنان الاين يدعمون حكومة السنيورة لعطالب حزب الك بالناء قرارات مانن‎ 
و يسود الوضع حينكذ الى ما كان عليه قبل السادسس‎ 
وإلخيار الاخر ان تحدث عونة الى الوضع الذي كان موجودا قبل السادس‎ 
.وإلخيار الاخر ان تحذث عودة الى الموضع الأي كان موجودا قبل السادس من ماب لا حل لكن لا تصعيد. وسيتر‎ 
رويترز) - تصاعدت اسو ازمة داخلية في لبنان منذ الحرب الاهلية (© 15.1507 ) بصورة حادة هذا الاسجوع‎ ... 
رويترز) - تصاعدت اسو ازمة داخلية في لبنان منذ الحرب الاهلية ( 1417 -151) بصورة حادة هذا الاسجوع ج‎ .. 
وفي بو السادس‎ 
شهرا مع تحالف #مارض بقباد‎ ٠١ .وقي يوم السادس دن مايو ايار اعلنت الحكومة التي نخوضن باشل صراعا منذ‎ 
وطلب حزب اللا وهو حركة سياسية لها جيش قوي تالف‎ 
ترفض الحكومة مطالب حزب الك. وترفض الجماعة بدورها التراجح. سيثهذ لبنان حينلا مزيذا.‎ 
ا را‎ 95 8 


الناجية الفعلية. ويمكن للجماعة وحلفائها المعارضين دعوة اتباعهم الذي 
الجكومة الى عدم الذهاب الى العمل با يزيد من اضعاف المؤسسات الحكومي 
يتحرك حزب الله للسيطرة فعليا على مباني الحكومة. لكن من غير المرجج ع 

لاقتحام المقار الرئيسية للحكومة التي يشغلها رئيس الوزراء فؤاد السني 

ان يخاول حزب الله الاستيلاة بصورة 

الحكومة بالصورة التي سيطرت بها حركة حماس على قطاع غزة عام ۲٠١۷‏ . وق 


حية القعلية. ويعكن لل -. 


.زعيم خزب الله ان الجماعة لن تستخدم اسلحتها لاحداث تشيير للحكومة 


هبو بها قد يسمح باستثناف الجهود لحل | 
ایی لا حل لكن لا تصديد. وسيترك| .إل 


Top: 46 Bytes: 8250 Insert 


شكل رقم )۲١(‏ لمعالجة برنامج K0 1-0۲041٥0٥‏ للنصوص العربية 


الحكومة تبقى في السلطة -- 


509 Total 136 


% 


6ه # 3 و2 و 


Headword 


- وبالضغط على كل كلمة من كلمات القائمة على حدة» يظهر البرنامج النص الذي 
يحوي هذه الكلمة مع ٠٠١‏ كلمة حوهاء ويمكن عمل قائمة (1156 5607) لبعض 
الكلمات والأدوات المتكررة كحروف المعاني» ويمكن كذلك تخصيص بعض الكلمات 
فقط بالعد والفهرسة دون الأخرى من خلال إعداد قائمة (150.آ علء21). 


۳ برنامج Textanz‏ (البرنامج المستخدم ف ا مبحث): 
يتميز برنامج 167822 عن برنامج Concordance‏ بمعالحة التراكيب - 
إضافة إلى معالجة الكلمات - فباختيار وظيفة (1211856): يعرض البرنامج التراكيب 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجار 


118 


المتكررة في النص''' مصحوبة بعدد مرات تكرارهاء وعدد کلات التركيب» فتركيب 
مثل: «المرشح الديمقراطي» عدد مرات وروده في النص المدرج (۲)» وعدد كلماته(؟). 


77 Textanz : UNREGISTERED 

Text Tools Hep 

٠ 8 | 4 5 5 ١ 70‏ ل ق :5 | <ا 8 + 3 

Phrase frequency | Concordance | Wordloms | Summay | Options | Te | 

أعلن باراك أوباما نفس ' المرشح الايمقراطي الرئاسة الأمريكية"' فى نو ثمبر القادم والتى باختيار الرئيس الرابع والأربعين للولايات الأمريكية المتجدة| 5 | Filer‏ 
وقال اناتور عن إلبنوي لحد كبير من أنصاره في اليوم الأخير من الانتخاباك التمهيدية للحزب الديمقراطي: ' أكون بلقاي لمنصب رئيس الولاياك المتحدة| .م | [equa [odê [dpe‏ 
دي وأنه بذلك قد فاز على السناتور هيلاري كلينتون في الباق الساخن الذي خاضاه للحصول على تذكرة الدخول للانتخابات الرئاسية الأمريكية في مواجهة السناتور الجمهوري جون ماكين 24 
وان فوز هبلاري لم يؤثر على عدد المندوبين لكل من المرشحين اذ بقي اوباما في الصدارة» أصرت زوجة الرئيس الأمريكي السابق على أنها لن تعلن انسحابها وستتخذ قرارها في وقت لاح 55 
.وكانث هيلاري حصلث في ساوث داكوتا على 44.5 بالمثة من اصوات الناخبين بيلما حاز اوباما على ؟ 5؛ بالمثة وذلك بعد فرز اكثر من 44 بالمثة من الاصوات| 0 


بالمثة من 


الت فبلاري إنها منفتحة على أن تكون نائبة ويام 41 ب 
في ساوث داكوتا 


ريون بعفد مؤتمرهم الوطني» أشاد اوباما بمنافصته هيلاري كلينتون على كسبها استحصان ملابين الناخبين وقال انه حصن من فرص فوزه مرشحا للحزب الديمقراطي من جراء منافسئه لياه 25 


۹ 


"وقال أوباما: "يجب ان نحرص على الخروج من العراق مثلما حرصنا على الدخول فيه ولكن يجب ان نيدأ بالرحيل وحان الوفث ليضطع العراقيون بالمسؤولية عن مستقبلهم 0 

بتوقع أوباما أن تنهمر عليه رسائل التأيبد من قبل أ عضاء الحزب الكبار 1885 

الكنه بالرغم من ذلك أشاد "بإنجازان الكثيرة" لماكين 189 

"من جانبها هنات هيلاري ذي خطاب لها في نيويورك أوباما وأنصاره على "كل ما حانقوه لان اوباما كان مصدر الهام لملابين الامربكبين» كما جعل الكثيرين يستعبدون ا0تمامهم بالصياسة 2 

.وكانت هيلاري قد ثالث ذي وفث سابق من النهار انها "منأتحة" على خوض السباق الانتخابي الى البيث الابيض كدائبة لاوباما 26 

وجاءث تصريحات هيلاري خلال اتصال هاتفي متعدد الاطراف اجرته مع نواب ديمقراطيين امربكيين؛ 

قالت مندوبة الحزب الايمقراطي نيديا فبلاسكبز لهبلاري ان اوباما سيفوز باصوات الجالية ذاث الاصول الامريكبة اللاتبنية في حال قبل هيلاري خوض الباق الرئاسي في منصب نائبة الرئيس| 4002 
"واجابت هيلاري حبئها انها ''منفتحة على دلك 4 

"وفي موازاة ذلك اعلن الرئيس الامريكي السابق جيمي كارتر دعم اوباما وقال ان "مناصري اوباما يعرفون جبدا ان صوئي سينضم البهم بعد اغلاق صناديق الاقتراغ اللبلية. 

"في المقابل» انتقد ماكين اوباما مساء الثلاناء قائلا ان "'لوباما يمثل التغيير الخاطيئ": مشيرا الى انه [ماكين) هو الذي" 

'"ووصك ماكين منائسه الديمقراطي ب"الرجل المثير للاعجاب وبخاصة للوهلة الاولى لكنه في الواقع لم بتمكن من تحدي حزبه وام يعرض نفسه لانثقادات مناصريه. اكنئي فعلت ذلك B211‏ 


7 
8 


Calculate | ¢ 2 


Total resuks:69 125 3206 bytes : CrlDocuments and Settingslagomaa\Desktop\New Text Document.txt 


شكل رقم (۲۲) لمعالحة برنامج 1٠×١7‏ للنصوص العربية 


ويمكن للبرنامج تظليل الكلات حل البحث ف مواضعها ف النص» ويتميز 
البرنامج بميزة أخرى وهي (501125 0۲۵5 ۷) التي تختص بعرض الصور المختلفة 
للكلمة الواحدة» حيث يعرض للكلمات متشابهة الحروف في النص الواحد, فكلمات 
مكل ”الركاسة”> الرتامبة > الرتاسى تاق جنيعًا شت الوخدة الرتاس +ويمكن 


١‏ - يمكن الإفادة من هذه الوظيفة في استخراج أكثر المتلازمات والتعابير المسكوكة شيوعًا في العربية المعاصرة» كا سيأتي. 


-1١١5- 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


التحكم في عدد حروف التشابه بتحديد أقصى عدد أو أقل عدد لحروف التشابه بين 
الكليات. 

ويمكن التحكم في نتائج البرنامج وغرجاته عن طريق مجموعة من الخيارات؛ مثل 
عدد الكلات في كل جملة» وعلامات تحديد بداية الجمل وغايتها من خلال علامات 
الرقبو: (5):()+(4)+(-)(1).ك] بظيو ف الشكل الآي: 
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شكل رقم (۲) لخيارات الفهرسة في بر نامج 1exta1Z‏ 


-11١ا/-‎ 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


ويمكن للبرنامج تلخيص النص تلخيصًا يستوعب: عدد كلماته» ومتوسط كلمات 
الجملة الواحدة» ومتوسط كلات الفقرة» ومتوسط حروف الكلمة الواحدة» وعدد 
ا لجمل» وعدد الفقرات» ومتوسط عدد الجمل للفقرة الواحدة» وعدد الأسطرء وعدد 
الحروف» وأطول كلمة» وأقصر كلمة» وأطول جملة وعدد حروفهاء وأقصر جملة وعدد 
حروفها. ويمكن كذلك عمل قائمة بالكلات ذات التكرار الكبير. 

كلمات التو قف “Stop Words”‏ : تضم كلمات مثل: «بين»» «اعن)» «من»» «على»» 
«قبل)» (بعد)» (عير)» (غير)» «(مھ|)» «ظل»» هما («حول)» «(دون)» «قل). 

ومن الحدير بالذكر التأكيد على أن هذه التقنيات بحاجة إلى التطوير والمعالحة لضان 
معالجة سليمة للعربية» فلاشك أن هناك مشكلات تخص العربية عند معالجتها بواسطة 
برامج الإحصاء اللغوي 200260102166 » من أهمها"": 

أ- مشكلة الصور المختلفة للدلالة الواحدة كم في الأعلام المترادفة - مشاكل 
الأخطاء الإملائية - السوابق واللواحق. 

ب- مشكلة الصورة الواحدة للدلالات المختلفة (ظاهرة اللبس الحاسوبي الصرفي 
والدلال)#اللبسن الصرق انالد 

ج- مشكلة فصل التراكيب المتلازمة. 


مقدمة فى التعريف بالمدونات اللغوية وأهدافها: 

يعرف د. المعتز بالله السعيد المدونة اللغوية بأنها كتلة غير منتظمة من النصوص 
المكتوبة أو المنطوقة التي تستخدم لدراسة جوانب اللغة» يمكن قراءتها والتعامل معها 
آليّا بعد إدخاها على الحاسب الآلي» كما يمكن التحكم في بياناتها ومدخلاتهاء بالإضافة 
أو الحذف أو التعديل من خلال قواعد بيانات (102]8153565) صَمّمت للتعامل مع 
هذه النصوص. وتعدٌ قاعدة البيانات الحاوية لنصوص المدونة اللغوية محزنًا كبيرًا 
للغة» يرجع إليه وقت الحاجة» ويتحمل أي قدر من النصوص التي تضاف إلى المادة 
الأساسية مستقبلا". 
١‏ - راجع للمزيد : من مشكلات التحليل النصي للمحتوى العربي على شبكة الإنترنت» د. سلوى السيد حمادة» - عمرو 
جمعة» المؤتمر الثامن للجمعية المصرية لهندسة اللغة (كلية ال هندسة- جامعة عين شمس) .7١١8-‏ 


۲ - مدونة معجم عربي معاصرء معالجحة لغوية حاسوبية» المعتز بالله السعيد» ص ٤‏ . 


-١1١8- 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


التعريف بالمدونة المستخدمة (مدونة لطيفة السليطى) في الدراسة: 

E a O E‏ ا 
للباحثة لطيفة السليطي» التي يعود تاريخها إلى سنة ٠١١ ٤‏ م» ويبلغ عدد كلماتها نحو 
مليون كلمة» وتحديدًا 4857775١‏ كلمةء وعدد مقالاتها 5١١‏ مقالة» وهم مجالاتها 
السياسة والاقتصاد والتعليم والرياضة» وهي مجمعة من الصحف والمجلات واللقاءات 
التليفزيونية والإذاعية وغيرهاء ومن الممكن تحميل المدونة من الموقع الخاص بالباحثة 
لطيفة السليطي على موقع جامعة ليدز البريطانية'''. 


Name Date modified Type 

ı Autobiography 24,2014 3:26 PM File folder 
ıı Children's Stories 5/24/2014 3:26 PM File folder 
|) Economics 3242014 3:26 PM File folder 
| Education 24,2014 3:26 PM File folder 
ıı Health and Medicine 324/2014 3:26 PM File folder 
| Interviews 3/24, 2014 3:26 PM File folder 

Politics 5/24/2014 3:26 PM File folder‏ ل 
lj Recipes 5/24/2014 3:26 PM File folder‏ 
ıı Religion 242014 3:26 PM File folder‏ 
Science 24, 2014 3:26 PM File folder‏ نا 
sclienceb 924,2014 3:26 PM File folder‏ لد 
ıı Short Stories 324,2014 3:26 PM File folder‏ 
li Sociology 24,2014 3:26 PM File folder‏ 

Jı Spoken 324/2014 3:26 PM File folder 
li Sports 324, 2014 3:26 PM File folder 
ıı Tourist and Travel 5/24/2014 3:26 PM File folder 


شكل رقم )۲٤(‏ لمجلدات مدونة لطيفة السليطي حسب مجالاتها 


١‏ - راجع: مدونة العربية المعاصرة؛ لطيفة السليطي. 
http: / /www.comp.leeds.ac.uk /eric /latifa /research.htm‏ في: ۱۳-۱۲-۲ *. 


A= 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


خطوات معالحة المدونة اللغوية باستخدام تقنیات الفهرسة والإحصاء 
اللغوية: 

١‏ - إعداد مادة المدونة للمعالحة الحاسوبية من خلال تحويل ملفاتها من صيغة 
(.21) إلى صيغة )]×٤.(‏ حتى يمكن لتقنيات الفهرسة الآلية التعرف عليها. 


Name Date modified Type Size 

A1 8/17/2004 2:17 PM XML Document 39 KE‏ إا 
AUTO2 8/17/2004 2:19 PM XML Document 16 KB‏ || 
A3 3/17/2004 2:24 PM XML Document 9 KB‏ اك 
PM XML Document 14 KB‏ 2:26 8/17/2004 04 اتن 
PM XML Document 17 KE‏ 2:21 6/27/2005 05ل اګ 
PM XML Document 15 KB‏ 2:29 8/17/2004 6 الاھ اكع 
AUTOT 6/27/2005 1:21 PM XML Document 31 KB‏ تكن 
PM XML Document 17 KB‏ 2:32 3/17/2004 8 ناه نك 
AUT09 8/17/2004 2:33 PM XML Document 12 KB‏ تكن 
PM XML Document 22 KB‏ 12:59 6/27/2005 0م حنم 
PM XML Document 14 KE‏ 2:36 8/17/2004 1ل كن 
PM XML Document 9 KB‏ 2:37 3/17/2004 2ل اك 
A13 3/17/2004 2:38 PM XML Document 14 KB‏ اك 
A14 8/17/2004 2:40 PM XML Document 17 KB‏ اك 
PM XML Document 33 KB‏ 2:41 8/17/2004 5الاھ إت 
A6 83/17/2004 2:42 PM XML Document 31 KB‏ تعن 
A7 83/17/2004 2:43 PM XML Document 18 KB‏ |= 
AUT18 3/17/2004 2:44 PM XML Document 47 KB‏ |8 


شكل رقم )٠١(‏ لملفات أحد مجلدات مدونة لطيفة السليطي في صيغة ۷1× 


- 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


؟ - إدخال ملفات المدونة (في صيغة .3:6]) إلى المفهرس» وإعطاء الأمر ببدء عملية الفهرسة. 


Contemporary Arabic project, June, 2003 Whole speech of",2,43,1606.5 Ê 
المشكلات البيئية مثل التلوث بانواعه المختلفة. التصحرء استنزاف الموارد الطبيعية. واستنزاف الطاقةء الاسراف في استهلاك المياه والغذاء"‎ 
تزايد الحرارةء التوسع العمرانيء قتل الغابات: الزيادة السكانيةء الفقرء الامية. المخلفات بانواعها المختلفة: التغيرات المناخية. الظواهر الطبيعية‎ 
2,43, 525674. كالزلازل والبراكين والفيضانات والاعاصيرء القاذورات؛: الحروب» الصيد الجائر: وغيرها",5‎ 

قول كبير باحثي قسم المخطوطات بسام بارود, وبين هذه المخطوطات قرابة خمسين مصحفا مخطوطا بخطوط متنوعة بين النسخ والمغربي" 
والفارسي, واقدم مخطوطة في المجمع عنوانها (مجالس في التصوف) نسخت سنة 1277م وهي مجموع مقالات في الوعظ والإرشاد مجهولة 
المؤلف",5 . 250150 ,39 ,2 
استقبلنا ببشاشة وجهه وبتواضعه الجم وحديته الفياض باحترام الآخرين والعرفان بجميلهم, فقد حدثنا خلفان المهيري مدير الثقافة والفنون" 
مطولا عن كتاب (كنت شاهدا) الصادر حديثا عن المجمع لمؤلفه الذي كان محررا بمجلة العربي في بداية رحلتها, وفي",5 . 250150 ,37 ,2 
الدأب في البحث المستمر والدقيق وراء المعلومة ذات الأبعاد الاستراتيجية والتي تؤثر في الأوساط الثقافية والسعي الدائم خلف مجريات" 
الأحداث بالغة التأثير على العالم قاطبة وعلى البلاد العربية بشكل خاص وتحليلاتها لكي تتبلور نتائجها أمام أولي",5 . 250150 ,36 ,2 

مائتين وخمسين كنابا ودراسة في مختلف المجالات, ومائة وستين نشاطا علميا متنوعا ونشرات يومية ترصد وتحلل الأحداث المحلية والعربية" 
والعالمية توفر الرؤية الجلية لأصحاب القرار وتخدم السياسات الراهنة والمستقبلية للدولة استنادا إلى المعلومات الموتوقة والإحصاءات 
الدقيقة",5 . 250150 ,36 ,2 
في واقع الحال لايمكن القول إن توزع المركز في الفلل السكنية عملي ولو كانت هذه الفلل متلاصقة أو متجاورة ومرتبطة تلفونيا وبشبكة" 
إنترنت, ولذلك عمل القائمون على المركز على تشبيد بناء فخم يتناسب ومكانةالمركز",5 . 250150 ,34 ,2 

المجمع الثقافي أولى هذه المحطات وهو هيئة ثقافية عامة وقصر للحضارة أيضا, وعلى صعيد أساسي يؤدي دورا رائدا في نشر الثقافة وإثراء" 
الفكر وتشجبع الفنون الرفيعة والابتكارات العلمية وتأصيل الثقافات الوطنية والارتقاء بها",5 . 250150 ,33 ,2 

هذه العناوين أبحاث في مواضيع تاريخية وترائية لها منزلتها عند الباحثين وفي تطور المجتمعات ولدى المهتمين ولذلك تتخاطفها المكتبات في" 


شكل رقم )۲١(‏ لأحد ملفات المدونة (في صيغة .]6) 


۳ - الحصول على نسخة من خرجات البرنامج في صيغة (.515) 


A B ICI 
1 | Phrase [frequency Words) Despersion 
2 قي‎ 2252 1 1336128.7 
3 على‎ 10428 1 1290747.3 
4 إلى‎ 7485 1 1375633.6 
5 عن‎ 4186 1 1318192.2 
6 | ما‎ 3998 1 1252597.4 
هذه أ7‎ 3426 1 1231669.9 
8| التي‎ 3144 1 1370186.5 
9 التي‎ 2998 1 1246599.9 
10 کان‎ 2450 1 1404437.4 
11 لا‎ 2359 1 |] 0 9 
12| ذلك‎ 219 1 1267966.4 
13 8 2165 1 950667.1 
14 بين‎ 2068 1 1267004.4 
15 کل‎ 1968 1 1315071.2 
16 5 1842 1 12274018 
17 8 1770 1 | 11823998 
18 | بعد‎ 1758 1 1375670 
19 | ان‎ 1713 1 999414.4 


جدول رقم (۲۷) لمخرجات تطبيقات الإحصاء في صيغة (.×ءا») 


د 1د 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


؛ - تحليل البيانات بعد فهرستها تحليلًا لغويًا؛ وتصنيفها بغرض إعداد مناهج 
دراسية لتعليم العربية وتعلمها؛ لاستخراج البيانات الأساسية في عملية تعليم العربية 
المعاصرة» وستقتصر الدراسة على بعض النتائج على سبيل المثال» على النحو التالي: 

البيانات التي يمكن استخراجها باستخدام تطبيقات الإحصاء الآليّة (إجالا): 

- إحصاء بأكثر ٠٠٠١‏ كلمة تكرارًا في اللغة العربية المعاصرة. 

- إحصاء بأكثر ٠٠١‏ متلازم استخدامًا في العربية في المعاصرة. 

- إحصاء بأكثر ٠٠١‏ مسكوك استخدامًا في العربية في المعاصرة. 

- إحصاء بأكثر ٠٠١‏ أداة نحوية استخدامًا في العربية. 

وذلك على التفصيل الآتي: 

إحصاء بأكثر ٠٠٠١‏ كلمة تكرارًا في اللغة العربية المعاصرة: 

تبدأ مرحلة التحليل اللغوي بعد الحصول على خرجات تطبيقات الفهرسة 
الإحصائية التي تتضمن عدد تكرار كل كلمة من كلمات المدونة بها مرتبة من الأعلى 
کارا إل الأقل تكرارًا؛ فإذا ما استثنينا الأدوات النحوية في العربية من الكلمات 
الأعلى تكرارًا وتردّدًا في المدونة اللغوية محل الدراسة» عن طريق استخدام قائمة ([51]0 
)؛ فيمكن حينئذ تحديد أكثر ٠٠٠١‏ كلمة تردّدًا وتكرارًا في العربية سوى هذه 
الآدوات النحوية» والتي يظهر بعضها من خلال الجدول الآتي: 
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-1١55- 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


| 1 | 349 | يم |36 قال |3ا 
347 جديدة | 37 579 الإتسان |14 
338 العراق | 39 آخر |16 
يكن | 40 العمل | 17 
المجتمع | 42 الإسلامية_ 19 
0 | الأمريكية | 43 المتحدة | 20 

1 324 جميع |46 ققسه |23 


جدول رقم (۲۸) لمخرجات تطبيقات الإحصاء في صيغة (.152):) 


ويمكننا من خلال الجدول السابق التعرّف على بعض الكلمات الألف الأعلى 
تكرارًا وتردّدًا في المدونة محل الدراسة» حيث يحل لفظ الجحلالة «الله) أولًا بتكرار قيمته 
١‏ » وتحل كلمة «العربية» ثانية بتكرار قيمته 11١545‏ » تليه) كلمة «عام» بتكرار 
قيمته ۱۲۲۷... إلى آخرها. 


أما الكلمات الألف الأكثر تكرارًا في المدونة محل الدراسة فهى - على سبيل الحصر-: 

ابن د ارتقاع خ ارد - سكام اسع داه اهاد الاجتواضي > الاجا 
الاحتلال - الاختلاف - الاقتصاد - الاقتصادي - الاقتصادية - الاميركية - الاهتمام 
- الإبداع - الإسرائيلي - الإسلام - الإسلامي - الإسلامية - الإعلام - الإنتاج - 
الإنترنت - الإنجليزية - الإنسان - الإنسانية - الإيهان - الأبحاث - الأخير - الأخيرة 
- الأدب - الأدبية - الأساسية - الأسباب - الأسرة - الأسواق - الأسود - الأشجار 
- الأشياء - الأطباء - الأطفال - الأعمال - الأقليات - الأمة - الأمر - الأمر - الأمر 
- الأمراض - الأمريكي = الأمريكية - الأمور = الأمير - الأوربية - الأوسط = الأول 
- الأول < الأيام + الاثان ‏ الاخر د الأهرين = الآية د الباب > البحث = البفخر 
- البحرية - البداية - البرامج - البرنامج - البشر - البشري - البشرية - البعض - 
البالادت اكد الت البيقة - البيقية - الغ التاويخ ‏ الناوغية = الال - الاد 


Y= 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


- التجارة - التجارية - التجربة - التراث - التربية - الترجمة - التعامل - التعاون 
- التعبير - التعليم - التقدم - التقنية - التنمية - الثالث - الثاني - الثانية - الثقافة - 
الثقافي - الثقافية - الثورة - الجامعة - الجانب - الجديد - الجديدة - الجراحة - الجزء 
- الجسم - الجميع - الجهات - الجهاز - ا لجال - الحالات - الحالة - الحالي - الحجاب 
- الحداثة - الحديث - الحديثة - الحرارة - الحرب - الحركة - الحرية - الحصول - 
الحضارة - الحق - الحقيقة - الحكم - الحكومة - الحكومية - الحوار - الحي - الحياة 
- الحيوان - الحيوانات - الخارج - الخارجية - الخاص - الخاصة - الخدمات - الخلايا 
- الخليج - الخير - الداخل - الداخلية - الدراسات - الدراسة - الدعوة - الدفاع 
- الدكتور - الدم - الدنيا - الدواء - الدور - الدول - الدولة - الدولي - الدولية 
2 ال < الذيية = الذات:- الرايع = الرأئ > الريعل > الرذة = الرسول 2 الرغم 
- الرواية - الرؤية - الرياض - الرئيس - الرئيسية - الزراعى - الزراعية - الزمان 
ع انين > AEN N EO E‏ 
السفر - السلام - السلطة - السماء - السنة - السنوات - السوق - السؤال - السياحة 
- السياحي - السياحية - السيارات - السيارة - السياسة - السيامي - السياسية - 
الما القاف < الفا - اا >< 0 عا ارق ا قلات الف كاف 
- الشركة - الشريعة - الشعب - الشعبية - الشعر - الشعوب - الشهال - الشمس 
- الشهر - الشيخ - الشيعة - الصباح - الصحة - الصحراء - الصحية - الصراع 
- الصغير - الصغيرة - الصلاة - الصناعة - الصناعية - الصورة - الضوء - الطاقة - 
الطب - الطبية - الطبيعة - الطبيعي - الطبيعية - الطرق - الطريق - الطريقة - الطعام 
- الطفل - الطلاب - الطلب - الطويل - الطيران - الظاهرة - الظروف - العام 
- العا مي - العالمية - العالي - العامة - العدد - العديد - العراق - العراقي - العراقية 
الارن القر ياك ا داه وود ال اهيدا اا 
- العلاقات - العلاقة - العلم - العلماء - العلمي - العلمية - العلوم - العليا - العمر 
- العمل - العملية - العناصر - العين - الغرب - الغربي - الغربية - الغرفة - الفترة 
- الفرنسى - الفرنسية - الفضاء - الفقه - الفقهى - الفكر - الفلسطينى - 1 
اناا لفق - اا ا < اع الفائوة > الفاح = القدرة 
- القدس - القدم - القديم - القديمة - القراءة - القرار - القرآن - القرن - القسم 


= 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


- القضية - القطاع - القلب - القول - القوى - القيام - القيم - الكاتب - الكائنات 
- الكبرى - الكبير - الكبيرة - الكتاب - الكتابة - الكتب - الكثير - الكريم - الكلام 
- الكويت - اللازمة - اللبنانية - اللجنة - اللغات - اللغة - اللقاء - الله - الليل - 
المادة - الماضي - الماضية - المبيدات - المتحدة - المتخصصة - المثال - المجال - المجتمع 
- المجتمعات - المجلس - المجمع - المحطة - المحكمة - المحلية - المختلفة - المدارس 
- المدرسة - المدن - المدينة - المذاهب - المرأة - المرحلة - المركز - المريض - المزيد 
- المسألة - المستقبل - المستوى - المسجد - المسلم - المسلمة - المسلمون - المسلمين 
- المشاركة - المشروع - المشكلة - المصادر - المصري - المصرية - المعلومات - المغرب 
- المكان - الملك - المملكة - المناسبة - المناطق - المنزل - المنطقة - المهمة - المواد 
- الموارد - الموت - الموضوع - الموقف - المؤسسات - المياه - المئة - النار - الناس 
د الناصر كالما الشاط > لكر النصن - الظاءت البظر- الس < اش 
- النقد - النمو - النوع - النوم - الهدف - الحند - الحواء - الحيئة - الواحد - الواقع 
- الوجه - الوجود - الوحدة - الوحيد - الوزراء - الوصول - الوضع - الوطن - 
الوطني - الوطنية - الوقت - الولايات - اليهود - امرأة - امس - إبراهيم - إجراء - 
إحدى - إدارة > إسرائيل - إسلامية - إضافة 2 إطار - إعادة = إقامة ك إنتاج ت إنسان 
- إنشاء - أبناء - أبو - أجل - أحد - أحيانا - أخذ - أخرى - أخرى - أخرى - أريد 
- أسباب - أشهر - أصبح - أصبحت - أصحاب - أعضاء - أعلى - أعمال - أفراد 
- أفضل - أقل = أقول- اکر د أكثر - آلف = الف = أم - آمر- أمراضن - أمريكا - 
أمس - أمين - أنحاء - أنواع - آهل - أهمية - أوربا - أول - أيام - آثار - آخر - آل 
- آلاف - باب - باسم - بالإضافة - بالرغم - بالفعل - بالنسبة - بداية - بدأ - بدأت 
- برامج - برنامج - بسبب - بسرعة - بشكل - بصورة - بطريقة - بعدها - بعض - 
بعضها - بعضهم - بعيد - بغداد - بقية - بلد - بلغ - بناء - بنسبة - بيت - بيروت 
- تاريخ - تأثير - تبدأ - تبقى - تجد - تجربة - تحتاج - تحدث - تحديل - محقق - تحقيق 
- تحمل - تدخل - تر - ترى - تستطيع - تشكل - تصل - تطوير - تظهر - تعتبر 
- تعتمد - تعد - تعرض - تعرف - تعمل - تعود - تعيش - تغيير - تقدم - تقديم - 
تقع - تقول - تقوم - تكون - تل - تم - تماما - تماما - تمثل - تنظيم - تنفيذ - توجد 
- توفير - تؤدي - ثانية - ثلاث - ثلاثة - جاء - جاءت - جامعة - جان - جانب - 


NY 8- 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


جائزة - جدا - جداً - جدة - جديد - جديدة - جزء - جعل - جميع - جميعا - جنوب 
- جهة - جهود - حاجة - حال - حال - حالات - حالة - حالياً - حجم - حدث 
- حدوث - حدود - حديث - حرارة - حرب - حركة - حرية - حسب - حسرا' 
- حسين - حقوق - حقيقة - حكم - حماية - حوالي - حياة - حياته - حياتي - حين - 
خارج - خاص - خاصة - خدمات - خدمة - خط - خطة - خلاها - > خلف - خلق 
- حمس - خمسة - بيب - دار - دائها - دائ - دخل - دراسة - درجة - دعم - دفع 
- دقيقة - دمشق - دور - دول - دولار - دولة - دين - ذات - ذاته - ذاتها - ذكر - 
ذل - رأس - رجل - رحلة - رد - رسالة - رسول - رضي - رمضان - روسيا - رؤية 
- رئيس - زمن - زوجها - زيادة - زيارة - سابك - ساعة - سبب - سبتمبر - سبق 
- سبيل - سطح - سعود - سعيد - سكان - سلامة - سن - سئة - سنوات - سوق 
- سوى - سؤال - سى - سيارة - سياسية - شاء - شاكر - شأن - شبكة - شخص 
- شخصية - شديد - شركات - شركة - شك - شكل - شال - شهر - شيء - شيئا 
- شيئا - صاحب - صحيح - صدام - صغيرة - صلى - صناعة - صوت - صورة - 
ضد - ضرورة - ضغط - ضمن - ضوء - طبيعة - طريق - طريقة - طلب - طوال 
- طويل - طويلة - ظاهرة - ظهر - ظهرت - ظهور - عادة - عا م - عالمية - عالية 
- عام - عاما - عاماً - عامة - عبارة - عبد - عبدالعزيز - عبدالله - عبر - عدة - عدد 
- عدم - عديدة - عربي - عربية - عرض - عشر - عشرة - عصر - عقد - علاج 
- علاقة - علم - علماء - علمية - عمر - عمره - عمل - عمله - عمليات - عملية 
- عهد - غرفة - غيره - غيرها - فتح - فترة - فرصة - فرنسا - فريق - فعل - فقال 
- فكرة - فلسطين - فلم - فما - فهم - قاعدة - قال - قالت - قام - قامت - قائلا - 
قائمة - قت - قدر - قدم - قرار - قسم - قصة - قضايا - قضية - قطاع - قطر - قطع 
- قطعة - قلت - قليل - قليلة - قوة - قوله - قيمة - كافة - كامل - كاملة - كبار 
- كبير - كبيرة - كتاب - كتابة - كتابه - كتب - كثير - كثيرا - كثيراً - كثيرة - كلمة 
داكله ح كلها ا كوي د لر د ليان = غ - العمل الت ا 
- مات - مادة - مائة - مباشرة - متر - متعددة - مثلا - مثلاً - مجال - مجالات - مجتمع 
- جرد - مجلة - جموعة - محاولة - محددة - محمود - مختلف - مختلفة - مدة - مدرسة 
- مدن - مدير - مدينة - مرات - مرة - مرحلة - مركز - مساحة - مسألة - مستوى 


-1١155- 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


- مشروع - مشكلة - مصادر - مصر - مصر - معدل - معنى - معينة - مفهوم - 
كان ديا وك وها ص وك کک و ا شيك 
- منطقة - منع - مهم| - مهمة - مواجهة - موسم - موضوع - مؤتمر - مؤسسة - مياه 
- ناحية - نتائج - نتيجة - نجد - نرى - نسبة - نشر - نص - نصف - نطاق - نظام 
- نظر - نفس - نفسه - نفسها - نفسي - نقص - نقطة - نقل - نهاية - نوع - هيكل 
- هيئة - واحد - واحدة - واسعة - واضحة - وأضاف - وبالتالي - وبعض - وجد 
- وجدت - وجه - وجود - وحدة - وحده - وحين - وخاصة - وراء - ورغم - 
وزارة - وزير - وسائل - وسط - وسلم - وصل - وضع - وعدم - وغير - وغيرها 
- وفق - وقال - وقث - وقع - وکل - وبقول - ويمكن - پأتي - يبدأ - يبدو - يبقى 
- يتعلق - يتم - يجب - يجب - يجد - يجعل - يجوز - يحتاج - يحدث - يحمل - يدخل 
- يريد - يزيد - يستطيع - يصبح - يعتبر - يعد - يعرف - يعمل - يعني - يعود - 
يعيش - يقدم - يقع - يقول - يقوم - يكن - يكون - يمثل - يمكن - ينبغي - يوجد 
- يوسف - يوم - يؤدي. 


إحصاء بأكثر ٠٠ ١‏ متلازم استخدامًا في العربية في المعاصرة: 

ينبغي بداية أن نعرّف بالمتلازمات اللفظية أو (التعابير السياقية) 

المتلازم اللفظي :Collocation‏ 

المتلازمات اللفظية: عبارة عن تلازم كلمتين أو أكثر بصورة شائعة في اللغة» تميل 
إلى ارتباط بعضها ببعض. لتماثل بين الملامح المعجمية لكل كلمة منهاء ومثاها: «انتهك 
حرمة)» «خرق معاهدة»» «كلمة مأثورة). 

ويطلق عليها البعض أساء أخرى مثل «المتصاحبات اللفظية» أو المتواردات أو 
المقترنات أو المترافقات اللفظية (770105 01106216128©) أو المصاحبات اللفظية أو 
التجمعات اللفظية . 


١‏ - التعابير الاصطلاحية والسياقية ومعجم عربي لماء د. علي القاسمي» بحث بمجلة اللسان العربي» مكتب تنسيق 
التعريب بالرباط» د.ت. ص9 7؟. 


۲ - نفسه» ص79. 


-/ا1- 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


إذن هو تلازم لمفردتين أو أكثر في سياق مطرد» وليس في استعمال مسكوك, نحو: 
حرب ضروس» جريمة نكراء» خسارات جسيمة» أو هو مركب لفظي من كلمتين أو 
مجموعة من الكلمات التي تتوارد مع بعضها بشكل متلازم. فكلمة «هطلت» -على 
سبيل المثال- تقترن في أغلب الأحيان بكلمة «الأمطار» فنقول «هطلت الأمطار» 
ولا نقول «هطلت الرياح» مثا أو نقول «خفيف الظل» ولا نقول «سريع الظل» أو 
«هش الظل». 

وقد تتكون هذه المتلازمات من: اسم وفعل مثل: «أدَى الزكاة» واأقام الصلاة“ 
واعبر النهر» و»خاض المعركة». أو اسم واسم مثل: «حقن الدماء» و»أداء الدين» 
و»الوفاء بالعهد). أو صفة واسم مثل «عابس الوجه» والين العريكة» واطويل الباع» 
أو اسم وحرف مثل «تخرج في جامعة ...). 


تحديد أكثر 5٠٠‏ متلازم استخدامًا في العربية في المعاصرة: 

لتحديد المتلازمات ينبغي حصر النظر وتركيزه في خرجات تطبيقات الإحصاء 
من التراكيب التي تتكون من كلمتين فأكثر من خرجات برامج الفهرسة الإحصائية 
وتقسيمها حسب غدد کلات كل تركيب» ابنداء بالتراكيب الصغرى ذوات الكلمتين 
ثم التراكيب ذوات الكلمات الثلاث وانتهاء بالتراكيب الكبرى ذوات الكلمات الأربع. 


-١58- 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


فعلى مستوى التراكيب ذوات الكلمتين: 


6 8 ير 
Phrase requencyj Words‏ 
القرآن الكريم 
| 2 | كه | الشرقالأوسط 
| 2 | 68 | حتوقالإسان 
اللغة العربية 
العالم الإسلامي 
| 2 | 44 | دولارأمريكي 
اترن التاسع 
| 2 | 40 | الخليج العربي 
| 2 | 38 | شهررمتان 
| 2 | 38 |20 طهحسين 
الاقتصاد السعودي 
الصحة العالمية . 
الضفة الغربية 
الغة الإنجليزية 
شيكة الإنترنت 
| 2 | 30 | حافظسلامة 
ليت النضائي 
الترات العربي 
الخطوط الجوية 
| 2 | 25 | حنيتيالولادة 


| 2 | 23 | الحروب الصليبية 


تم | نم 


جدول رقم (۲۹) لمخرجات تطبيقات الإحصاء من التراكيب ذوات الكلمتين 


بيده 


23 الحضارة الإسلامية 


O 0O ل-‎ ت١‎ UO bh uw هب نزخ‎ 


فب | کے | كس | فس | a‏ 
© بک دم یں حل 


فل | شك | كس | نے | 
الا @ لد تن ف 


تخ تم تخ تم 
© س رم دن 


يُلحظ من الوهلة الأولى للنظر في مخرجات تطبيقات الفهرسة الإحصائية من 
التراكيب ثنائية الكلمات اشتمال هذه المخرجات على الأعلام والكيانات مثل: «القرآن 
الكريم» و»الشرق الأوسط)وهو أمر طبيعي؛ لتكرر مثل هذه الأعلام والكيانات في 
نصوص المدونة محل الدراسة» ومن الممكن الإفادة منه تعليميًا. 


أما التراكيب المتلازمة ثنائية الكلمات الأكثر تكرارًا مثل:»حديثى الولادة» و 


عاب 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


مل م 


«(تقنره 


المعلومات» و «رجال الأعمال» فكلها تراكيب تتلازم في كلماتها عادة» ويمكن تقديمها 
لمتعلم العربية في صورها المتلازمة بوصفها أكثر المتلازمات تكرارًا وتردّدًا في العربية. 

ومن ثم يمكن حصر أكثر المتلازمات الثنائية تكرارًا وتردّدًا في المدونة حل الدراسة 
فيه| يأتي: 

القرآن الكريم - الشرق الأوسط - حقوق الإنسان - اللغة العربية - العام 
الإسلامي - دولار أمريكي - القرن التاسع - الخليج العربي - شهر رمضان - 
الاقتصاد السعودي - الصحة العالمية - الضفة الغربية - اللغة الإنجليزية - شبكة 
الإنترنت - البث الفضائي - التراث العربي - الخطوط الحوية - حديثي الولادة - 
الحروب الصليبية - الحضارة الإسلامية - الحضارة العربية - للأمم المتحدة - البحر 
الأحمر - القدس الشرقية - المدينة المنورة - مدينة القدس - والولايات المتحدة - 
الكائنات البحرية - الموارد البشرية - مليار ريال - الدين الإسلامي - الشرق والغرب 
- الغرب والسلمون - القرف القارق -الياه القوفية > اميس اومن تقنية العلومات 
- الجزيرة العربية - مجلس الوزراء - الأمم المتحدة - البلاد العربية - التربية الفنية - 
الحياة الاجتماعية - الدول النامية - الشعب الفلسطينى - الاتحاد السوفييتى - الأدب 
الإسلامي - الأقلية المسلمة - الأمة الإسلامية - التجارة الغالية > اغا الثانوي 
- الخدمات المصرفية - القراءة والكتابة - المحاصيل الزراعية - بالمنطقة الشرقية - 
بالولايات المتحدة - الاقتصاد العالمى - التنمية الاقتصادية - الدول الإسلامية - 
ان اغى ال ا اا للاخ د ريطا بسر 
الله - رجال الأعمال - الدراسات العليا - الرئيس الفرنسي - القرن الخامس - حرب 
الخليج - دار الكتب - دول الخليج - البحر المتوسط - القرن السابع - المتحف العراقي 
- المجتمع المدني - دار العلوم - ريال سعودي - قطاع غزة - مجلس التعاون 


e 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


A B ا‎ C 
Phrase requency) Words 


3 | 2# | المملكةالمربيةالسسودية_ | 
| 3 | © ا 


الولايات المتحدة الأمريكية 
_ 3 | 61 | ىلەه 
1 3 | 8ة | اناشع عقر 
| د | 28 | الحرب المامية الثقية 
1 3 | 5 | منطقة اشرق الأوسط 
| 3 | 22 | عمرين الخطاب 
| 3 | 18 | الله- عز وجل 
| 3 | 18 | تتي أكسيد الكريون 
| 3 | 17 | _جميع أتحاء العالم 
| 3 | 16 )| إن تنا الله 
| 3 | 1 | عليه الصلاة والسلام 
3_| 14 | ا 
| »ا 1 1 
3 | 14 | شير رمتان امبر 
E E E E‏ 21 
| 3 | 13 | ملياردولار أمريكي 
| 3 | 11 | البنك السعودي الهولندي 
| 3 | 11 | دول مجلس التعاون 


ف سد | سد | سد سد سد بد ا فب فيه 
ه- | تنا | ظ١‏ |[ "تي | 9 | ل- | 02 | 8 | ق | ه | دح | ين | كد | صن | 26 | بك | مه | ما 


يم 
> 


3 
ا 
مآ 

ا 
0 


3 10 الامارات العريية المتحدة 


يم 
دن 


جدول رقم )۳١(‏ لمخرجات تطبيقات الإحصاء من التراكيب ذوات الكلمات الثلاث 


ا 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


حيث يمكن تحديد المتلازمات ثلاثية الكلمات الأكثر تكرارًا في المدونة المستخدمة 
على سبيل الحصر وفق مايأتي: 

المملكة العربية السعودية - الولايات المتحدة الأمريكية - رضى الله عنه - القرن 
التاسع عشر - الحرب العالمية الثانية - منطقة الشرق الأوسط - عمر بن الخطاب - 
الله- عز وجل - ثاني أكسيد الكربون - جميع أنحاء العالم - إن شاء الله - عليه الصلاة 
والسلام - القرن الثامن عشر - سوق حراء الدولي - شهر رمضان المبارك - مليار 
ريال سعودي - مليار دولار أفريكي = البناك السعودي المولندي - دول مجلس 
التعاون - علي رضي الله - عمرو بن العاص - الإمارات العربية المتحدة - العام العربي 
والإسلامي - الميزانية العامة الجديدة - دول مجلس التعاون - رضي الله عنهم - طلاب 
التعليم المدرسي - والولايات المتحدة الأمريكية - الرئيس جورج بوش - وزارة التربية 
والتعليم - أسلحة الدمار الشامل - الغرف التجارية الصناعية - أحداث ١١‏ سبتمبر - 
توت عنخ آمون - حسن كامل الصباح - منطقة الخليج العربي - القرن الخامس عشر 
- القرن السابع عشر - جائزة نوبل للسلام - القرآن الكريم والسنة - القرن الحادي 
والعشرين - القرن الواحد والعشرين - باللغتين العربية والإنجليزية - جامعة الدول 
العربية - جامعة الملك سعود - دول الخليج العربي - دول العام الثالث - دول مجلس 
التعاون - عبدالله بن عبدالعزيز - الدول العربية والإسلامية. 


= 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


وعلى صعيد التراكيب ذوات الكلمات الأربع: 


1 | Phrase requency}| Words 
2 4 
3 التعليم المدرسي داخل المنزل‎ | 39 | 4 
4 | الخطوط الجوية العربية السعودية_‎ 4 
5 | مناطق المملكة العربية السعودية_‎ 4 
6 | مدن المملكة العربية السعودية__‎ 4 
7 |__ داخل المملكة العربية السعودية‎ 4 
8 علي رضي الله عنه‎ 4 
9 عمر ين عيد العزيز‎ 4 
10| خارج المملكة العربية السعودية‎ | 9 | 4 
11 في كل أتحاء العالم‎ |) 95 | 4 
12| حقوق الإنسان في الإسللم___‎ | 8 | 4 
3] عمس-رضياشعه‎ | 8 | 4 
14 غلتفى اكىيدالكرسن‎ | 8 | 4 
15 الاتحاد العربي قي كويا‎ 0 
16| البطالة في الاقتصاد السمودي__‎ 4 
17 | أنحاء المملكة العربية السعودية_‎ 4 
18) بسم الله الرحمن الرحيم‎ 4 
19 دولة الإمارات العربية المتحدة‎ 0 
20 شركات إعادة التأمين العالمية‎ 4 
21 شركة قجر للاستتمار السياحي‎ 4 
22 شيخ الإسلام ابن تيمية‎ 3 
23 | صندوق تنمية الموارد البشرية__‎ 4 


جدول رقم )۳١(‏ لمخرجات تطبيقات الإحصاء من التراكيب ذوات الكلمات الأربع 


يمكن تحديد المتلازمات ذوات الكلمات الأربع الأعلى تردّدًا وتكرارًا في المدونة على 
سبيل ا حصر فيا يأتي: 

صل الله عليه وسلم - التعليم المدرسي داخل المنزل - الخطوط الجحوية العربية 
السعودية - مناطق المملكة العربية السعودية - مدن المملكة العربية السعودية - داخل 
المملكة العربية السعودية - علي رضي الله عنه - عمر بن عبد العزيز - خارج المملكة 
العربية السعودية - في كل أنحاء العالم - حقوق الإنسان في الإسلام - عمر - رضي الله 


2 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


عنه - غاز ثاني أكسيد الكربون - الاتحاد العربي في كوبا - البطالة في الاقتصاد السعودي 
- أنحاء المملكة العربية السعودية - بسم الله الرحمن الرحيم - دولة الإمارات العربية 
المتحدة - شركات إعادة التأمين العالمية - شركة فجر للاستثار السياحي - شيخ 
الإسلام ابن تيمية - صندوق تنمية الموارد البشرية - الرسول عليه الصلاة والسلام - 
لا إله إلا الله - السعودية ودول الخليج العربي - القرن التاسع عشر الميلادي - القرن 
الخامس عشر الميلادي. 


إحصاء بأكثر ٠٠١‏ مسكوك استخدامًا في العربية المعاصرة: 

قبل البدء في إحصاء أكثر المسكوكات استخدامًا في العربية المعاصرة سنعرّف 
بالمسكوكات أو التعابير الاصطلاحية. 

المسكوك أو (التعبير الاصطلاحي) (111012): «وحدة لغوية (تضم أكثر من وحدة 
معجمية بسيطة)» يقع في الاستعال اللغوي باطراد» وله دلالة ثابتة تختلف عن الدلالة 
المعجمية لمفرداته مفردة أو مركبة» » فتكوين التعبير الاصطلاحي قائمٌ على «سلسلة 
من الكلمات التي تُقيِّدها عوامل دلالية وتركيبية تجعل منها وحدة دلالية جديدة. 

ولم يول اللغويون القدماء اهتمامهم بهذا النوع من التعبيرات إلا فيهما ندر» ى) أن 
الباحثين المعاصرين لم يكونوا أكثر اهتمامًا من سابقيهم برصد هذه التعبيرات ودراستها؛ 
فلم تَحْظ إلا باهتمام عدد قليل من الباحثين» انصرفت عنايتهم عادة إلى التعابير القديمة 
الموجودة في ثنايا كتب التراث“ )ولم تكن هناك قواميس أحادية - أو حتى ثنائية - اللغة 
للمتلازمات في العربية على غرار قاموس 001106261055 021050 في اللغة الإنجليزية 
مثلاء حتى أخرجت الدكتورة وفاء كامل فايد ”معجم التعابير الاصطلاحية في العربية 
المعاصرة” عمدت فيه إلى حصر التعابير الاصطلاحية في العربية الحديثة والمعاصرة» 


١‏ - راجع: علم الدلالة» د. أحمد ختار عمر» عالم الكتب» القاهرة» طم ام ص ۲۲-۲۲ وراجع: المعجم السياقى 
للتعبيرات الاصطلاحية» محمود إسماعيل صيني وآخرون» مكتبة لبنان ناشرون» بيروت» ط ۱۹۹٦۰٠.‏ م» ص ح (المقدمة). 


۲ - الأسس النظرية لوضع معجم للمتلازمات اللفظية العربية» أسس المعجم النظري» د. محمد حلمي هليّلء مجلة 
المعجمية» تونسء 1991م ع ۱۲ ۱۳» ص2 775. 


۴ - بعض صور التعبيرات الاصطلاحية في العربية المعاصرة» د. وفاء كامل» مجلة مجمع اللغة العربية بدمشق» المجلد //ا 
الجزء٤»‏ ص 45-6 


ا 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


وهو معجم أحادي اللغة» مبني على مدوّنة نصوص موسعة «(Corpus based)‏ ويضم 
أما المدونة التي أمدّت المعجم بادته فتضم نصوصًا لغوية تمثل اللغة العربية 
الحديثة والمعاصرة في محالات مختلفة: [الأدب باختلاف أجناسه (من روايات وقصص 
ومسرحيات عربية ومترجمة للناشئة وللكبار) - الفنون - العلوم - الرياضة - 
الاجتماعيات - السياسة - الاقتصاد- الدوريات العلمية» والمجلات الأدبية والنقدية» 
والسياسية» رال بو والاتجفاغية» والثقافية الفكرية» والسائية» عاتصدر فق كل من 
مصر والكويت والإمارات والسعودية وسوريا ولبنان ولندن... ] ويصل حجم المعجم 
إلى 65٠٠‏ صفحة"" . 

وقسمت الدكتورة وفاء كامل التعابير الاصطلاحية المعاصرة تقسيًا نحويًا تركيببًا 
0 

المركب الإضافي» ومن أمثلته : آخِرٌ العنقَوو-؟ سيج الجتمَع ا الكو داعت 
ان الل حَفِيفٌ الظل - حت الشمْس- الرس - ابْنَنُكْمَةِ - ابن حَلالٍ - ابن 
ا خلال - أَعْمَى الْقَلْبِ د كلانه ا 

المركب الوصفيء ومن أمثلته: الاو اا القتقية ا د ليد اد 
اطوط الْعَرِيضَةٌ - اسوق السَوداء - باب حَلَفِيٌ لذا - برج عاجيّ - الط السوداءُ 
- اال ارام - کلام فَارِعٌ - كلام مُبَطَنْ - الكَلِمَُ العلا ابتِسَامَةٌ صَفْرَاء. 

المرب الفخلء ومن أمثلته: َج صَذرَه - أَعْطَى الضَّوْءَ ا - يرفع الرَاية 
البَيِضَاءَ - جَرَ إلى الحلبة - يفن الرُووس في الرّمَالٍ - به بِِكَنٍ ارد - يَضْطَاد في 
ام اْعَكِر - أَرَاهُ جوم طهر - بيص وَجْهَ فلانِ - أَحَدَ بيد فلانِ - أَحَدَّ عى حَاطِرِهٍ 


ياج 


ات n‏ نسر العَسِيلَ القَذِرَ - تفخ 
يه - نفخ في قربة مقط عَةٍ - ترك اليل عل الْغَاربٍ. 
للركب الاسمي؛ ومن امت : اللِّبُ في الوَفْتِ الضّائِع - اللعِبُ عَلَ المكُوفٍ - 


الِب بالتار - ال عل بطال - اروخ مِنْ عق الزجاجة - زَُوْبَعَةٌ في فِنْجَان - - ربط 


١‏ - معجم التعابير الاصطلاحية في العربية المعاصرة» د. وفاء كامل» القاهرة» طا» ۰*۰۷ ۲ ص (ح). 


۲ - بعض صور التعبيرات الاصطلاحية في العربية المعاصرة» د. وفاء كامل» مجلة مجمع اللغة العربية بدمشق» المجلد //ا 
الجزءة. ص ۸۹۸ وما بعدها. 


ا 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


ةع اعون - امي الَعَسَلٍ ولول لذي له - بصلته محروقة. 
TS‏ : بالفم المليان - عل کف عفريت 
- بعد خرَابٍ مَالطة - قوق صَفِيح سَاحْنٍ - بِالبركة - في ذيل القائمة - (أَصْبََ) في 
حبر کان درا اذى - بالباع والذّمَاع - يدم بَارِدٍ - بربطة المعلم- بدون لف أو دوران. 


ومن المهم إيجاز الفروق بين التعابير الاصطلاحية والتعابير السياقية کا نص عليها 
د. علي القاسمي في) يلي': 

إمكان استشفاف معنى التعبير السياقي من فهم دلالة عناصره» أو الكلمات المكونة 
له على حدة» فقولنا: «خرق المعاهدة» يعني يعنى (انتهك الاتفاقية»)؛ أن «خرق» تعني 
«انتهك»» و)المعاهدة) : تعنى (الاتفاقية»). 

يكن ذكر ا ايزا اي الا دوك ذكر الجزء الثاني المكون له» فنستطيع أن 
نقول: «القدس» دون أن نردفها بكلمة «الشريف». 

تمتاز التعابير السياقية بقدرتها على التنوع أي إِنّه يمكن تبديل الكلمات المكونة 
للتعبير السياقى بكلياث ممائلة لما دلالتها دون الإخلال بمعتى التعبير الكل» ففى 
التعبير السياقي «ثلةٌ من الجيش» يمكن أن نقول: «جماعةٌ من الجنودا» وا مجموعةٌ من 
العسكر). 


١‏ - راجع: التعابير الاصطلاحية والسّياقية ومعجم عرب لهاء د. علي القاسمي» بحث بمجلة اللسان العربي» مكتب تنسيق 
التعريب بالرباط» د.ت. ص4 كبره 


ا 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


تحديد المسكوكات ف المدونة حل الدراسة بواسطة تطبيقات الفهرسة الآلية: 


A B (¢‏ 
Phrase | frequency Idiom Words‏ | 1 
2 18 سبيل الله 2 
3 17 في سبيل الله 3 
3 14 بغض النظر عن 4 
3 13 وعلى سبيل المثال | 5 
2 13 على أيدي 6 
2 10 على يديه 7 
2 6 العلاقات العامة 8 
2 6 وصلة الأرحام | 9 
3 5 على مدار الساعة | 10 
3 5 على مدار العام 11 
2 4 ابن آدم 12 
3 3 بعد العمل الجراحي | 13 
4 2 على قلب رجل واحد | 14 
2 2 النسيج الاجتماعي | 15 


جدول رقم (۳۲) لمخرجات تطبيقات الإحصاء من بعض المسكوكات 


تتعدد المسكوكات في العربية بتعدد عدد كلماتهاء فهناك المسكوكات ثنائية الكلمات 
وهناك المسكوكات ثلاثية الكلمات. إلى آخر أنواعها المتعددة بتعدد كلماتباء وتتفاوت 
أعدادها وتردداتها وتكراراتها في العربية المعاصرة حسب أعداد كلماتها؛ فالدراسة 
الإحصائية تنبئ عن أن أعداد المسكوكات الثنائية وتكرارها وترددها في العربية أكثر 
من أغداة السك كات الف واعداه المسكركات الغلائية أك مين أغداد ال اة 
بطبيعة الال 


- 0 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


إحصاء بأكثر ٠٠١‏ أداة نحوية استخدامًا فى العربية: 
إن الملحوظة الأول في عملية التحليل اللغوية للمدونة محل الدراسة تكمن في أن 
الكلمات الأعلى تكرارًا وتردّدًا في المدونة من نصيب الأدوات النحوية في العربية: 


A B C D 


1 Phrase |frequency | Words Despersion 
e 
3 على‎ 
4 إلى‎ 
5| عن‎ 
6 م‎ 
7| هه‎ 
8| التي‎ 
9| التى_‎ 
06] كد‎ 
11 لا‎ 
12 تلك‎ 
13 ق‎ 
14] بينت_‎ 
15 کل‎ 
16| هى‎ 
17 


بد 18 
ان 19 


جدول رقم (۳۳) لمخر جات تطبيقات الإحصاء من بعض الأدوات النحوية الأكثر تكرارًا في 
العربية 


فحرف الجر «في» هو الأداة الأعلى تكرارًا بين أدوات النحو العربية» بتكرار قيمته 
75 وي يليه حرف الجر «على) بتكرار قيمته 577 ٠١‏ » يليه حرف الجر (إلى») بتكرار 
قيمته 7585 » وهكذا إلى آخر هذه الأدوات. وهو تحليل يثى بأهمية حروف الجر 
ودورها في ترابط الجملة العربية ومن ثم اعتبارها أَوْى الدروس العربية بالتعلم لدارس 
العربية. وني هذا إشارة إلى استخدام الفعل في العربية بشكل كبير» فحروف الجر في 
a‏ 
العربية وشيوع الجملة الفعلية بشكل أكبر من الجملة الاسمية. 


-١78- 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


ويلي حروف الجر من الأدوات أسماءٌ الإشارة؛ فاسم الإشارة (هذه) يتكرر في 
المدونة ۳٤۲١١‏ مرة » فيه| يتكرر اسم الإشارة (ذلك) 2711/4 وهو مؤشر على المنزلة 
الثانية للدروس النحوية عامة أو للأدوات النحوية خاصة بعد حروف الجر. 

ثم يأتي دور الأسماء الموصولة بوصفها أكثر الكلمات تكرارًا في العربية؛ فيتكرر الاسم 
الموصول «الذي» "١55‏ مرة» يليه الاسم الموصول «التي) بتكرار قيمته ۲۹۹۸. 

بلي ذلك الفعل الناسخ «كان» بتكرار قيمته 555٠‏ في المدونة محل الدراسة» ثم 
حرف النفي (لا» بتكرار قيمته 77064. 


ويمكن حصر هذه الأدوات المائة في يأتي: 

فق دعل إل دعن = ما ت هذه الذي الى = كان = لا - ذلك د و بين 
كل - هو - لا - بعد - ان - كىم| - حتى - قد - وقد - كانت - التي - وفي - ولا - غير 
- وهو - ثم - أو - عليه - فيها - قبل - مع - بها - فيه - تلك - به - الذين - فى - ها 
- بل - مثل - هناك - ولكن - وهي - عند - أو - وكان - خلال - منذ - عليها - و 
-فقد - الآن - دون - فإن = مم = إن دعل - أو - هل دای = غندما = وماد أو 
- وم - إن - أو - بن - لقد - لكن - حول - هي - ليس - التي - فقط - فيه| - إليه 
عي - أيضا دواغل د خلال د وذلك دمع < ع د وال د 1 - تحت - لد وفل 
دإ د أمام دا ححيت - إلا - إليها إلا 

ولأن من سمات العربية ارتباط كلاتها بالسوابق واللواحق؛ فقد أتت هذه 
الكلمات مكررة ضمن الائة الأولى من الأدوات النحوية الأكثر تكرارًا في العربية 
لارتباطها بسوابق ولواحق مختلفة ولعدم اعتتاد تطبيقات الفهرسة الإحصائية على 
التحليل الصرفي عند الإحصاءء وهي من مشكلات التطبيقات اللغوية العربية.'') 


- بيان كيفية الإفادة من خر جات تقنيات الإحصاء في مناهج تعليم العربية للناطقين 
بالعربية أو لغير الناطقين مها: 

ينبغي التأكيد على أنه ليس الهدف من المبحث اكتشاف أكثر الكلمات أو المتلازمات أو 
المسكوكات أو الآدوات النحوية دورانًا في العربية المعاصرة» بل ال هدف هو رسم منهج 


١‏ - راجع: بحث «من مشكلات التحليل النصي للمحتوى العربي على شبكة الإنترنت» د.سلوى السيد حمادة» عمرو 
جمعة» مؤتمر هندسة اللغة۸٠٠۲.‏ 


س 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


محدد وطريقة علمية صحيحة لاكتشاف هذه الكلات أو المتلازمات أو المسكوكات أو 
الأدوات النحوية الأكثر دورانًا. 

فالمبحث إنا يرسم الطريق ويضع المنهج» ومن الممكن لباحث آخر أن يعمد إلى 
مدونة أكبر من مدونة المبحث تتكون من ملايين الكلمات» فتكون النتائج أدق وأكثر 
شمولًا للعربية المعاصرة كلهاء وأشمل فائدة لمتعلم العربية ومعلمها. ومن الممكن 
كذلك استخدام المنهج ذاته لمعرفة أكثر الكلمات دورانًا في نصوص تخصص ماء كأن 
يعمد الباحث إلى مدونة متخصصة ويحللها بواسطة تطبيقات الفهرسة الآلية لمعرفة 
أكثر الكلمات دورانًا في نصوص هذا التخصص. فيكون التركيز عليها عند تعلم كلمات 
هذا الحقل الدلالي المتخصص. 

ومن المهم التنبيه إلى أن ذلك لا يقلل من قيمة المبحث ونتائجه» وهي نتائج محددة 
وفقا للمدونة مادة الدراسة» ولكن الدراسة تقدم تصوّرًا مبدثيًا لما يمكن أن تكون عليه 
النتائج في حال معالجة مدونة لغوية أكبر حجن من المعالجة في هذه الدراسة. 

ويمكن إيجاز كيفية الإفادة من رجات تقنيات الإحصاء في مناهج تعليم العربية 
للناطقين بالعربية أو بغيرهاء كل على حدة. 

ففيها بخص إحصاء أكثر ٠٠٠١‏ كلمة تكرارًا في اللغة العربية المعاصرة يمكن الإفادة 
من هذه النتائج في تحديد أكثر الكلمات دورانًا وتكرارًا في العربية المعاصرة؛ كا يمكن: 

ربط هذه الكليات حسب حقوها الدلالية وتقديمها لدارس العربية ومتعلمها من 
الناطقين بها أو بغيرها ضمن الحقل اللغوي الخاص بهاء فالكلمات: ألف - عشر - 
مائة - ثلاث - ... كلمات تدخل تحت الحقل الدلالي «الأرقام والأعداد» » والكلمات: 
يوم - سنة - عام - شهر - أسبوع - ... كلمات تحت الحقل الدلالي «التاريخ والوقت». 

ربط هذه الكلمات حسب جذورها الثلاثية والرباعية في العربية لتسهيل ربط 
الكلرات ذوات الخد رالراحد»قالكلرات: "غيل *- "غيل" لات ع 
ذات جذر واحد؛ هو ”عمل“ وكذلك الكلمات: ”الدول“ - ”الدولة“ - ”الدولي“ - 
”الدولية“ ذات جذر واحد؛ جذرها ”دول“. وهي خطوة نحو معجم لغوي لأكثر 
الكلمات تكرارًا في العربية المعاصرة أسوة بهذا النوع من المعاجم في بعض اللغات. 

تصنيف هذه الكلمات حسب أنواع الكلم في العربية إلى ”الاسم“ و“الفعل“ مع 
تجاهل تصنيف ”الحرف“ لوجوده ضمن قائمة الأدوات النحوية الأكثر استعمالا في 
العربية المعاصرة. 


ا 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


أما ما يتعلق بإحصاء أكثر 0٠١‏ متلازم استخدامًا في العربية في المعاصرة» وإحصاء أكثر 
٠‏ مسكوك استخدامًا في العربية في المعاصرة فيمكن الإفادة منهما في الخروج عن النمط 
المألوف في المعاجم العربية إلى معاجم للمتلازمات والمسكوكات» وهو فرع تحتاج المكتبة 
العربية فيه إلى العديد من المعاجم المتخصصة. مع إمكان تقديم تر حمة هذه المتلازمات 
والمسكوكات إلى بعض اللغات» وهذا سيساعد الكثير من المترجمين -إضافة لمتعلمى 
العربية من الناطقين بغيرها - في التعرف على معاني هذه المتلازمات والمسكوكات في 
العربية بلغاتهم الأم. فترجمة المسكوك تختلف بشكل جذري عن ترجمة ما سواه في أي لغة. 

أما إحصاء أكثر ٠٠١‏ أداة نحوية استخدامًا في العربية» فير جى منها إحصاء أكثر مائة 
أداة نحوية استخدامًا في العربية المعاصرة» وتحديدها وربطها ببعضها وتحديد دروسها 
النحوية الكلية» لتقديمها لمتعلمي العربية المعاصرة من الناطقين بها أو بغيرها في الإطار 
النحوي الكلي بشكل عام. فالأدوات المائة الأكثر استخدامًا في العربية تجمعها - من 
بين ما تجمعها = حروف الخر وأسماء الأشازة والأساء الموضولة والضاتر والظروف 
وأدوات النفي والاستثناء» وهي دروس نحوية من المهم لدارس العربية تعلمها 
كأساس لتعلم نحو العربية المعاصرة؛ أعني نحوها المعتمد على الواقع المستخدّم وليس 
على التنظير البعيد عن الواقع أو ما يمكن أن نسميه بالمهمل من اللغة وقواعدها. 


النتائج والتوصيات: 

الخروج بإحصاءات عن أكثر ٠٠٠١‏ كلمة تكرارًا في اللغة العربية المعاصرة» وعن 
أكثر ٠٠١‏ متلازم وأكثر ٠٠١‏ مسكوك استخدامًا في العربية المعاصرة» وأخيرًا أكثر 
٠‏ أداة نحوية استخدامًا في العربية. 

رسم هذا المبحث منهجًا محدّدًا وطريقة علمية لاكتشاف الكلمات أو المتلازمات أو 
المسكوكات أو الأدوات النحوية الأكثر دورانًا في العربية المعاصرة. 

يوصي المؤلف بمعالجة مدونة لغوية أكبر حجًاء تتكون من ملايين الكلمات تكون 
شاملة لمستويات العربية المختلفة لضمان نتائج دقيقة وتفصيلية. 

يوصى المؤلف باتخاذ نتائجه من الكليمات والمسكوكات والمتلازمات والأدوات 
النحوية نواة لمجم عربي معاصر وقاموس متعدد اللغات من العربية إلى غيرها من 
اللغات. 


= 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


الخاتمة 


حاول الكتاب في| مضى من صفحاته أن يجعل من التقنيات اللغوية الحاسوبية محورًا 
للدراسة» فعرض للمعايير اللغوية لتقييم بعض التقنيات الحاسوبية التي تعالج اللغة 
التعرف الضوئي على الحروف العربية. 

وتوصل الكتاب إلى تحديد خمسة معايير لغوية لتقييم تعامل محرك البحث مع 
كلمات البحث على المستوى الصرفيء وإلى تحديد ثلاثة معايير لغوية لتقييم تعامل محرك 
البحث مع كلمات البحث على المستوى الدلالي. ىا توصل إلى تسعة معايير لتقييم 
برامج التعرف الضوئي على الحروف العربية وعلى حركات الضبط بالشكل. وتوصل 
الكتاب كذلك إلى سبعة معايير لغوية لتقييم برامج التدقيق الإملائي والنحوي. 

ثم انطلق ليقدم رؤى تطويرية لتقنيتين من التقنيات اللغوية؛ أولاهما برامج التعرف 
الآلي على الحروف العربية؛ إذ اقترح المؤلف نموذجًا لغويًا مدا لحل مشكلات 
التعرف على الحروف العربية على مستوبي النصوص المعاجَة؛ مستوى النصوص غير 
المضبوطة بالشكل» ويقوم على خمس خطوات من خطوات المعالجة المرتبة التي تقود 
فيه كل خطوة إلى أختها. ومستوى النصوص المضبوطة بالشكل اعتمادًا على القواعد 
اللغوية المحوسبة» ضاريًا المثال بحرف الهمزة. 


= 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


وثانية الرؤى التطويرية تخص برامج التدقيق اللغوي؛ إذ اقترح الكتاب فكرة آلية 
لغوية هدفها تقريب العربية من أهلهاء باستخدام أداة لغوية مدمجة (28111811) تعتمد 
على خرجات برامج التدقيق اللغوي» وعلى قاعدة بيانات تحليلية تمكن الآلية من تقديم 
التأصيل العلمي للقضية محل الإشكال إملائيًا أو نحويًا أو تركيبيًا بغرض تعليمي. 

ثم أراد المؤلف أن ملك اند آقاقا جديدة لاستخدام بعض التقنيات اللغوية 
فاقترح مراجعة النص القرآني وتدقيقه آلا من خلال آلية لغوية هدفها التدقيق الإملائي 
واللغوي للنص القرآني في نسخه الرقمية برسمه العثاني» معتمدة في عملها على ثلاث 
من الأدوات الحاسوبية؛ الإحصائية (على مستوى الحرف والكلمة ونهايات الآي 
وصفحات المصحف) واللغوية (من خلال خصائص الحروف العربية وخصائص 
حركات الضبط بالشكل وخصائص الحركات العربية مع بعض ال حروف (تطبيقا على 
ال همزة)» وأخيرًا أدوات معالجة الرسم العثاني آليّا من خلال حوسبة قواعد الرسم 
العثاني (حذف بعض الحروف وزيادة بعض الحروف وكتابة الهمزة على غير القياس 
واستبدال حرف بحرف والفصل والوصل بين أجزاء كلمات القرآن). 

وأخيرًا عرض المؤلف لاستخدام تقنيات الإحصاء اللغوية في تحليل النصوص 
اللغوية يدف الخروج بإحصاءات دقيقة من شأنها إفادة المستخدم العربي والتأثير في 
واقعه» وقد خرج الكتاب بعد معالجته لمدونة لغوية في العربية المعاصرة تقرب من مليون 
كلمة باستخدام تقنيات الإحصاء اللغوية؛ بإحصاء عن أكثر ٠٠٠١‏ كلمة تكرارًا في 
هذه المدونة» وأكثر ٠‏ متلازم دورانًا فيهاء وأكثر ٠٠١‏ مسكوك استخدامًا فيهاء 
وأكثر ٠٠١‏ أداة نحوية استخدامًا على مستوى هذه المدونة. 

وبعد فقد قدم الكتاب رؤية مؤلفه لتقييم التقنيات الموجودة ووسائل تطويرها 
ومستقبلهاء آملّا أن تكون لبنة في صرح كبير لمعالجة العربية وحوسبتها. والله ولي 
التق 


%% 


= 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


فهرس المراجع والمصادر 


فهرس المراجع 


أولاً: المراجع 

الإتقان في علوم القرآن» عبد الرحمن بن أبي بكرء جلال الدين السيوطي» تحقيق: 
محمد أبو الفضل إبراهيم» دار التراث» د.ط» د.ت. 

استخدامات الحروف العربية (معجمياء صوتياء صرفياء نحوياءكتابيا)» سليان 
فياض» دار المريخ» السعودية» د.ط» ۱۹۹۸ . 

الإملاء والترقيم في الكتابة العربية» عبد العليم إبراهيم» مكتبة غريبء القاهرة» 191/0 م. 

البرهان في علوم القرآن» محمد بن بهادر بن عبد الله الزركشي» تحقيق: محمد أبو 
الفضل إبراهيم» دار المعرفة - بیروت» د.ط . ١191١ه.‏ 

دليل الحيران شرح مورد الظمآن. إبراهيم بن أحمد المارغني التونسي» مكتبة الكليات 
الأزهرية - القاهرة - ٠۹۸۱‏ م. 

علم الدلالة» د. أحمد مختار عمرء عالم الكتبء القاهرة» ط5. /99١م.‏ 

معجم التعابير الاصطلاحية في العربية المعاصرة» د. وفاء كامل» القاهرة» .۲٠٠۷ 2١‏ 

المعجم السياقى للتعبيرات الاصطلاحية» محمود إسماعيل صيني وآخرون. مكتبة 
لبنان ناشرون» بیروت» ط.١1919521م.‏ 


ك 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


المعجم الوسيط» إبراهيم مصطفى» أحمد حسن الزيات» حامد عبدالقادر» عمد على 
النجار» مجمع اللغة العربية بالقاهرة» ط. ؟» 5 .٠٠١‏ 

النحو الأسابى» د. أحمد ختار» د. مصطفى النحاس» د. تحمل حماسة» دار السلاسل» 
الکویت» .١995‏ 

النحو الوافي. د. عباس حسن. دار المعارف. ط". مصرء القاهرة» أج5.صضص411 - ج٣‏ . 


ثانيا: الرسائل الجامعية 

اللبس في البنية والتركيب؛ أناطه وأسبابه وآثاره وطرق التخلص منه» دراسة 
نحوية حاسوبية في العربية المعاصرة» عمرو جمعة عبد الرسول» رسالة دكتوراه بكلية 
دار العلوم» جامعة القاهرة» .7١ ١5‏ 

اللغة العربية المعاصرة في المجال السياسي» دراسة لغوية حاسوبية من واقع ذخيرة 
لغوية هة سيد راقده رسال ةماحسسن كل الال جام عن شمسواره 1 

مدونة معجم عربي معاصر» معالجة لغوية حاسوبية» المعتز بالله السعيد طه» رسالة 
ماجستير» كلية دار العلوم» جامعة القاهرة» 557/7 ١ه/‏ ا 


ثالثا: الأبحاث العلمية 

الأسس النظرية لوضع معجم للمتلازمات اللفظية العربية» أسس المعجم النظري» 
د. محمد حلمي هليّل» مجلة المعجمية» تونس» ۱۹۹۷ م» ع 2175 17. 

بحوث ومقالات في اللغة» د. رمضان عبد التواب» مكتبة الخانجي بالقاهرة» ط. ٠‏ 
6ه-1940م. ْ 

بعض صور التعبيرات الاصطلاحية في العربية المعاصرة» د. وفاء كامل» مجلة مجمع 
اللخة العربية بدمشقء المجلد 8لا الموء؟ . 

تطوير التعرف الآلي على الحروف العربية» عمرو جمعة عبد الرسولء الندوة الدولية 
السادسة لعلوم وهندسة الحاسوب » 7٠١٠١‏ تونس. 

التعابير الاصطلاحية والسّياقية ومعجم عربي هاء د. علي القاسمي » بحث بمجلة 
اللسان العري» مكحتب تسيق التعريببالرياط»ة ة,ت: 

التقاء الحروف المتماثلة في القرآن الكريم» د. محمد زكي خضر ء مجلة الفرقان» العدد 
٠ف‏ آذار .75٠١5‏ 

قواعد البيانات المحملة على الأقراص المدمجة: دراسة حالة لقاعدة بيانات الإنتاج 
الفكري الإسلامي ON °D-ROM‏ 15142110175 12110186 » هاشم فرحات» مجلة 


312 8- 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


مكتبة الملك فهد الوطنية » مجلد ٦‏ » عدد ۲ (رجب_ذو الحجة ١47ه/‏ أكتوبر 7٠١ ١‏ 
مارس ۲۰۰۱م). 

المعايير اللغوية والفنية لتقييم برامج التعرف الضوئي على الحروف العربية» عمرو 
خا عند الول مؤقر عسة هندسة اللغة الحاشرع ٠٠١١‏ القاس غم 

تن ك وت التحليل السى التمضرى الغرى عل ك ار ت دسلوى الس 
مواق فيرو ا موقن a‏ للع ار د 

من كات الال النضى لمق رى غل ال تت د مار اليد 
حادق = عبرو ج ال العامة للجمعية اله دة الل (كلية اة 
جامعة عين شمس) -۲۰۰۸. 


رابعا: المواقع والصفحات على الإنترنت 

http: / /faculty.ksu.edu.sa /Alhendawy /My/.20publications //D9/.8 
2005 + 2 8ك‎ 
00103: شا‎ 01 

http: / /wiki.arabeyes.org / مستبعدات_الفهرسة‎ 

http: //www.al-mishkat.com /khedher /wp-admin /Papers / 
paper18.pdf 

http: / /www.coltec.net /default.aspx?tabid=2 24. 

http: //www.coltec.net /Portals /0 /COLTEC_PDFs /ProofingTool_ 
NEW.pdf 

http: / /www.comp.leeds.ac.uk /eric /latifa /research.htm 

http: / /www.concordancesoftware.co.uk / 

http: / /www.cro-code.com /textanz.jsp 

http://www.diwanalarab.com /IMG /pdf/Is_ 
hamaatUolamaaAltaumieat1-1.pdf 


http: / /www.sakhr.com /arabicresources.aspx. 


ا 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


فهرس الكتاب 


مقدمة الكتاب 
الفصل الأول معايير تقييم التقنيات اللغوية 
المبحث الأول المعايير اللغوية لتقييم برامج التدقيق الإملائي والنحوي 


هيد 

مدى توافر عدة مستويات لعمل المدقق الإملائي 

مدى معالحة تطبيقات التدقيق الإملائى لأنماط الأخطاء الإملائية الشائعة في 
النصوص العربية 

مدى معالحة تطبيقات التدقيق الإملائي للبسين الصرفي والدلالي وحل مشكلاتى| 
مدى معالحة تطبيقات التدقيق النحوي لآثار اللبس التركيبى 

مدى نجاح عملية الت لتصحيح التلقائي على المستوى الإملائي 


مدى تعلم المدقق الإملائي والنحوي من تصحيحات المستخدم ومدى استفادته من 
هذه التصحيحات ف التصحيح التلقائى 


-١85ا/-‎ 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


مدى جاهزية المدقق الإملائي والنحوي للتعامل مع علامات الضبط بالشكل بنية 
وإعرابا. 

الملبحث الثاني المعايير اللغوية لتقييم محركات البحث العربية على شبكة الإنترنت 
المعايير اللغوية لتعامل محرك البحث مع كلمات البحث على المستوى الصرفي 
مراعاة التدقيق اللغوي للمدخلات(]112211) 

مراعاة الأشكال الكتابية 


مراعاة زوائد الكلمة العربية (من السوابق واللواحق) Affxes (Preflxes-‏ 
(suffixs‏ 


المعايير اللغوية لتعامل محرك البحث مع كلمات البحث على المستوى الدلالي 
مراعاة الترادف (577110117711277) 

مراعاة المشترك اللفظي (110120117722(7) 

مراعاة اللبس الصرفي على مستوى كلمات البحث وعلى مستوى كلمات التوقف 


المبحث الثالث المعايير اللغوية والفنية لتقييم برامج التعرف الضوئي على الحروف 
العربية 


عهيد 
مشكلات التعرف على الحروف العربية 


المعايير اللغوية والفنية لتقييم برامج التعرف الآلي على الحروف العربية 

المعيار الأول: التعرف على جميع حروف الخطوط العربية المستخدمة فى الكتابة 
العربية 

المعيار الثاني: التعرف على علامات الضبط بالشكل (علامات التشكيل) والتفرقة 
بينها وبين نقط الإعجام 


المعيار الثالث: التعرف على الأرقام العربية بصورتيها الهندية والعربية 
المعيار الرابع: التعرف على علامات الترقيم 


-١5- 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


5 


0 


المعيار السادس: التعرف على الصور والأشكال الرسومية 
المعيار السابع: مدى استخدام المعارف اللغوية في عملية التعرف الآلي على الحروف 
المعيار الثامن: وجود تقنية لغوية متقدمة تمكنها من التصحيح التلقائي 


المعيار التاسع: مدى الاستفادة من تصحيحات المستخدم وأخطائه السابقة 


الفصل الثاني رؤى مطروحة لتطوير بعض التقنيات اللغوية 


المبحث الأول تطوير تقنيات التدقيق الإملائي والنحوي لتفعيل دورها في تعليم 
العربية 


مقدمة 

الدراسات السابقة 

التعريف بتطبيقات التدقيق الإملائي والنحوي 10015 721001128 

استتخدام التقئيات اللغوية في تعليم العربية إلكترونيا 

الأخطاء الإملائية والنحوية الشائعة وكيفية الإفادة من تصحيح هذه الأخطاء في 
تعليم العربية 


أولا المدقق الإملائي 

الأخطاء الإملائية الشائعة في النصوص العربية 

ثانيا المدقق النحوي: 

التعريف بالمدقق النحوي :Arabic Grammar Checker‏ 
كيفية عمل المدقق النحوي: 

بعض الأخطاء النحوية الشائعة في النصوص العربية: 

خاتمة الملبحث 


الملبحث الثاني تطوير التعرف الآلي على الحروف العربية 


عات 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


1 


1۷ 


تمهيد 
الأسباب المادية لمشكلات التعرف على الحروف العربية 

مشكلات التعرف على الحروف العربية» وتكمن في: 

أولا : معالجة النصوص غير المضبوطة بالشكل 

طرق اكتشاف هذه المشكلات لغويًا ( وتكون من خلال عدة قواعد لغوية غير 
صرفية ) 

الحروف المتعاقبة وغير المتعاقبة 

حروف الالتباس 

ترتيب الحروف العربية إحصائيا حسب كثرة الدوران في العربية 

خصائص الحروف العربية من حيث الشكل والموضع من الكلمة 

توالي الأمثال في العربية 

ثانيا : معالجة النصوص المضبوطة بالشكل 

ا 

بعض القواعد والخوارزميات اللغوية الخاصة بالتعرف على حركات الضبط 
والتشكيل. 

الخصائص العامة للحركات العربية 

خصائص الحركات العربية مع ا حروف (تطبيقًا على ال همزة) 

احتمالات تشكيل ال همزة 

الخائمة 

الفصل الثالث آفاق استخدام بعض التقنيات اللغوية 

المبحث الأول مراجعة النص القرآني وتدقيقه آلا 


مهيد 


١6ه.‎ 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


1۷ 


1۸ 


المقدمة 

الآدوات الحاسوبية المقترحة التي تتضمنها آلية تدقيق المصحف 
الأدوات الإحصائية 

مستويات التدقيق باستخدام تطبيقات الإحصاء والفهرسة اللغوية 
التدقيق على مستوى حروف الكلمات القرآنية 


التدقيق على مستوى الكلمات من خلال تحويل النص القرآني إلى قائمة كلمات "۲٠×‏ 
to list‏ 


التدقيق على مستوى رؤوس الآي ونايات الصفحات في مصحف المدينة 
الأدوات اللغوية 

خصائص ال حروف العربية 

خصائص حركات الضبط بالشكل (حركات التشكيل) 

أدوات معالجة الرسم العثماني آليا 

قواعد الرسم العثماني 

الوجه الأول: الحذف 

الوجه الثاني: الزيادة 

الوجه الثالث: ال همز 

الوجه الرابع: البدل 

الوجه الخامس: الفصل والوصل 

الخاتمة 

المبحث الثاني تحليل النصوص باستخدام تقنيات الإحصاء اللغوية في صناعة مناهج 


تعليم العربية 


مهيد 


کد 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


مقدمة 
من الدراسات السابقة 

التعريف بالأدوات والتقنيات المستخدمة في الدراسة: 

مقدمة في التعريف بتقنيات الإحصاء والفهرسة اللغوية 

عرض تفصيلي لأهم تطبيقات الفهرسة الإحصائية 

Concordance برنامج‎ 

برنامج 16712112 البرنامج المستخدم في المبحث 

مقدمة في التعريف بالمدونات اللغوية وأهدافها 

التعريف بالمدونة المستخدمة (مدونة لطيفة السليطي) في الدراسة 

خطوات معالجة المدونة اللغوية باستخدام تقنيات الفهرسة والإحصاء اللغوية 
البيانات التي يمكن استخراجها باستخدام تطبيقات الإحصاء الآلية 

إحصاء بأكثر ٠٠٠١‏ كلمة تكرارا في اللغة العربية المحاصرة. 

إحصاء بأكثر ٠٠١‏ متلازم استخداما في العربية في المعاصرة. 

تحديد أكثر ٠٠١‏ متلازم استخداما في العربية في المعاصرة 

إحصاء بأكثر ٠٠١‏ مسكوك استخداما في العربية في المعاصرة. 

النتائج والتوصيات. 

خاتمة الكتاب 

فهرس المراجع 


فهرس الكتاب 


== 


- هذه الطبعة إهداء من المركز ولا يسمح بنشرها ورقياً أو تداولها تجارياً - 


1۱۲ 


1۱۳ 


£٤ 


1۷ 


تقنيات إللغة إالغربية الحاسوبية 
معايير التقييم ورؤى التطوير 


الدراسات 5 


يهدف هذا الكتاب إلى تقديم منهج لغوي لتقييم التقنيات اللغوية الحاسوبية التي تعالج اللغة العربية. من خلال عدد من المعايير 
اللغوية. فنظرة واحدة على بعض التقنيات العربية كافية لإدراك الهوة الواسعة بين مخرجات هذه التقنيات وبين ما يجب أن تكون 
عليه النتائج المرجوة. ومن ثم دعت الحاجة إلى وضع لبنة لغوية لمعايير تقييم هذه التقنيات. وستقتصر هذه المعايير على الجانب 
اللغوي فقط تاركة الجانب الفني للمتخصصين فيه 

كما يهدف الكتاب إلى تقديم رؤى تطويرية جديدة لتطوير بعض التقنيات اللغوية العربية. يمكن من خلالها رفع كفاءة هذه 
التقنيات وتحسين جودة مخرجاتهاء كما هو الحال مع تطبيقات التعرف الآلي على الحروف العربية: أو يمكن من خلالها إبراز 
الدور التعليمي لهذه التقنيات الحاسوبية: كما هو الحال مع المدققات الإملاتية والنحوية؛ إذ يمتد دور هذه التقنيات اللغوية العربية 
إلى الإسهام ب4 تعليم مستخدميها من العرب قواعد العربية كذلك؛ إضافة إلى دورها الأساسي ب2 معالجة العربية آليًّا. 


د. عمرو جمعة 


0 مركز الملك عبدالته بن عبدالعزيز الدولي 


King Abdullah Bin Abdulaziz Int'l Center for ® 


The Arabic Language 
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